localizaÇÃo de fontes de sinais em presenÇa de … · dissertação de mestrado apresentada ao...

INSTITUTO MILITAR DE ENGENHARIA

ELOI DRANKA JUNIOR

LOCALIZAÇÃO DE FONTES DE SINAIS EM PRESENÇA DEDISTORÇÕES ACÚSTICAS NÃO-ESTACIONÁRIAS COM

USO DE SENSORES FRACIONÁRIOS

Dissertação de Mestrado apresentada ao Curso deMestrado em Engenharia Elétrica do Instituto Militar deEngenharia, como requisito parcial para obtenção do títulode Mestre em Ciências em Engenharia Elétrica.

Orientador: Rosângela Fernandes Coelho - Docteur ENST

Rio de Janeiro

2014

c2014

INSTITUTO MILITAR DE ENGENHARIAPraça General Tibúrcio, 80-Praia VermelhaRio de Janeiro-RJ CEP 22290-270

Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-loem base de dados, armazenar em computador, micro�lmar ou adotar qualquer forma dearquivamento.

É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecasdeste trabalho, sem modi�cação de seu texto, em qualquer meio que esteja ou venha aser �xado, para pesquisa acadêmica, comentários e citações, desde que sem �nalidadecomercial e que seja feita a referência bibliográ�ca completa.

Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es) e do(s)orientador(es).

xxxx Dranka Junior, E.Localização de Fontes de Sinais em Presença de Distorções

Acústicas Não-Estacionárias com uso de sensores fracionários /Eloi Dranka Junior. - Rio de Janeiro : Instituto Militar de Engen-haria, 2014.

83 p.: il.

Dissertação (mestrado) - Instituto Militar de Engenharia - Rio

de Janeiro, 2014.

1. Engenharia elétrica - dissertações. 2. Processamento desinais. 3. Localização de fontes Acústicas I. Título II. InstitutoMilitar de Engenharia.

CDD 621.3822

2

INSTITUTO MILITAR DE ENGENHARIA

ELOI DRANKA JUNIOR

LOCALIZAÇÃO DE FONTES DE SINAIS EM PRESENÇA DEDISTORÇÕES ACÚSTICAS NÃO-ESTACIONÁRIAS COM

USO DE SENSORES FRACIONÁRIOS

Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétricado Instituto Militar de Engenharia, como requisito parcial para obtenção do título deMestre em Ciências em Engenharia Elétrica.

Orientador: Rosângela Fernandes Coelho - Docteur ENST

Aprovada em 03 de Fevereiro de 2014 pela seguinte Banca Examinadora:

Rosângela Fernandes Coelho - Docteur ENST do IME - Presidente

Marley Maria Bernardes Rebuzzi Vellasco - PhD da PUC/Rio

Paulo Fernando Ferreira Rosa - PhD do IME

Paulo César Pellanda, Dr. ENSAE do IME

Rio de Janeiro2014

3

AGRADECIMENTOS

Agradeço primeiramente a Deus por ter me dado esta oportunidade única de realizar uma

pós-graduação.

À Prof. Rosângela, minha orientadora, que desde o início não me negou atenção, me

mostrou o correto caminho a ser seguido e impôs necessária cobrança para que este tra-

balho fosse concluído da melhor maneira possível.

À minha esposa, Tita, que me acompanhou no decorrer desta jornada e me confortou nos

momentos mais difíceis.

Aos meus pais, que desde cedo me incentivaram a seguir o caminho dos estudos e sempre

me apoiaram em minhas decisões.

Aos companheiros de Laboratório, Leonardo Zão e Rodrigo Tavares, que em muito me

ajudaram no decorrer deste trabalho.

E a todos os professores do IME que colaboraram para que eu pudesse chegar ao �nal

desta jornada.

4

SUMÁRIO

LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

LISTA DE SIGLAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.2 Resultados Obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2 LOCALIZAÇÃO DE FONTES ACÚSTICAS: CONCEITOS E

DEFINIÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1 Localização baseada em TDE: de�nição e métodos . . . . . . . . . . . . . . . . . . . . . 23

2.2 Localização baseada em Energia: de�nição e métodos . . . . . . . . . . . . . . . . . . 28

2.3 Desa�os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3 LOCALIZAÇÃO DE FONTES BASEADA NO RETARDO TEM-

PORAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.1 Método de localização acústica SRP-PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.1.1 Estimador de retardo temporal PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.1.2 Localizador de fontes Acústicas baseado no SRP . . . . . . . . . . . . . . . . . . . . . . . 37

3.2 Proposta de Localização de Fontes Acústicas - Método SRP-H-PHAT . . . . 39

3.2.1 Expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.2.2 Estimação do expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2.3 Ruído fracionário Gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.2.4 Estimador de retardo temporal H-PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.2.5 Índice de Não-Estacionariedade (INS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5

3.3 Resultados de Localização Acústica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.3.1 Cenário dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.3.2 Estimação do INS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.3.3 Estimação do expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.3.4 Resultado da localização do SRP-PHAT com ruídos reais e ruído

descorrelatado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.3.5 Resultados de localização com o método Proposto SRP-H-PHAT . . . . . . . . 55

3.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4 LOCALIZAÇÃO DE FONTES BASEADA EM ENERGIA ACÚS-

TICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.1 Método ML-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2 Método Proposto H-ML-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.3 Resultados dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.3.1 Distância de Bhattacharyya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.3.2 Cenário dos experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.3.3 Resultados do ML-Energia com ruídos reais . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.3.4 Resultados de localização do método proposto H-ML-Energia . . . . . . . . . . . 70

4.3.4.1 Comparação dos métodos de Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

4.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.1 Sugestões para trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5.2 Comentários Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6 REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . 80

6

LISTA DE ILUSTRAÇÕES

FIG.2.1 Duas arquiteturas empregadas nos sistemas de localização de fontes

acústicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

FIG.2.2 Correlação cruzada entre dois sinais defasados de τ = 100 ms. O

ponto de máximo da correlação corresponde ao valor do retardo

entre eles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

FIG.2.3 Exemplo de uma localização EBL. A fonte é representada pelo

quadrado vermelho. Os sensores são indicados pelos círculos e

os asteriscos ilustram as posições estimadas para a fonte a cada

quadro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

FIG.3.1 Lugar geométrico dos pontos com mesmo valor da função SRP de

um ponto que passe pela posição da fonte gerada para uma fonte

única e dois sensores. (a)Hiperboloide em 3D; (b)Hiperboloide em

3D cortado por um plano; (c)Hipérbole em 2D resultante do corte.

Figura extraída de (VELASCO, 2012). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

FIG.3.2 Lugar geométrico dos pontos com mesmo valor da função SRP de

um ponto que passe pela posição da fonte gerada para uma fonte

única e dois pares de sensores independentes. (a)Hiperboloide em

3D; (b)Hiperboloide em 3D cortado por um plano; (c)Hipérbole

em 2D resultante do corte. Figura extraída de (VELASCO, 2012). . . . . 39

FIG.3.3 Representação de uma função SRP gerada da leitura de 3 sensores

durante a localização do sinal, cuja fonte geradora está localizada

na posição (2,6 ; 2,6). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

FIG.3.4 Decomposição de um sinal pela transformada wavelets discreta em

3 escalas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

FIG.3.5 Etapa �nal do processo de estimação (regressão linear) de H de 3

sinais arti�ciais. Os valores verdadeiros de H de cada sinal são

(a)H = 0, 2, (b)H = 0, 5 e (c)H = 0, 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

FIG.3.6 Resultado da estimação dos valores de INS dos sinais acústicos reais,

(a)Avião, (b)Balbúrdia, (c)Motoserra, (d)Helicóptero, (e)Voz e

(f)Metralhadora. A linha em vermelho representa os valores de

7

INS e o tracejado em verde, os valores de limiar de estacionaridade. . . . 48

FIG.3.7 Resultado da estimação dos valores de INS dos ruídos acústicos

reais, (a)Carro, (b)Navio, (c)Veículo Militar, (d)F16, (e)Míssil e

(f)Assovio. A linha em vermelho representa os valores de INS e o

tracejado em verde, os valores de limiar de estacionaridade. . . . . . . . . . . 49

FIG.3.8 Espectrogramas dos sinais e ruídos acústicos. . . . . . . . . . . . . . . . . . . . . . . . 50

FIG.3.9 Estimação do expoente de Hurst para as fontes (a)Avião e

(b)Metralhadora, considerando quadros de 1024, 2048 e 4096

amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

FIG.3.10 Resultado da localização de fonte usando método SRP-PHAT e

SRP com ruídos reais. As linhas em azul indicam a média de

acertos de localização. As linhas em vermelho são as médias de

acertos obtida considerando ruído descorrelatado. A �gura ilustra

a média de acertos de localização das fontes Motoserra (a) e (b),

Balbúrdia (c) e (d) e Avião (e) e (f). Os grá�cos (a), (c) e (e)

mostram o resultado com blocos de 2048 amostras, já (b), (d)

e (f) apresentam-no para a localização realizada com quadros de

4096 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

FIG.3.11 Comparação entre localização obtida pelos métodos SRP-PHAT e

SRP-H-PHAT com quadros de N = 2048 amostras. A linha em

azul mostra o resultado médio obtido na localização das fontes

quando o ruído real é empregado. Já o traço em verde representa

a meta que se deseja alcançar no método de localização. . . . . . . . . . . . . . 58

FIG.3.12 Comparação entre localização obtida pelos métodos SRP-PHAT e

SRP-H-PHAT com quadros de N = 4096 amostras. A linha em

azul mostra o resultado médio obtido na localização das fontes

quando o ruído real é empregado. Já o traço em verde representa

a meta que se deseja alcançar no método de localização. . . . . . . . . . . . . . 59

FIG.4.1 Resultado da localização utilizando ML-Energia com ruídos reais.

Os histogramas mostram o erro de estimação de�nido na EQ. 4.19,

para cada fonte corrompida com um determinado ruído, men-

cionado na legenda, a um valor de SNR de 5 dB. . . . . . . . . . . . . . . . . . . . 68

8

FIG.4.2 Resultado da localização utilizando ML-Energia com ruídos reais.

Os histogramas mostram o erro de estimação de�nido na EQ. 4.19,

para cada fonte corrompida com um determinado ruído, men-

cionado na legenda, a um valor de SNR de 10 dB. . . . . . . . . . . . . . . . . . . 69

FIG.4.3 Resultado da localização utilizando ML-Energia com ruídos reais

e H-ML-Energia. Os histogramas mostram o erro de estimação

de�nido na EQ. 4.19, para cada fonte corrompida com um deter-

minado ruído, mencionado na legenda, a um valor de SNR = 5

dB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

FIG.4.4 Distância de Bhattacharrya entre ML-Energia e ruídos reais (em

vermelho) e H-ML-Energia e ruídos (linhas azuis), para os valores

de SNR entre 0 dB e 20 dB e quadros de 2048 amostras. . . . . . . . . . . . . 74

FIG.4.5 Distância de Bhattacharrya entre ML-Energia e ruídos reais(em

vermelho) e H-ML-Energia e ruídos (linhas azuis), para os valores

de SNR entre 0 dB e 20 dB e quadros de 4096 amostras. . . . . . . . . . . . . 75

FIG.4.6 Comparação entre os métodos ML-Energia, H-ML-Energia e a lo-

calização com ruídos reais para as fontes Avião e Voz. A linha

em verde mostra o RMSE obtido quando as fontes são distorcidas

por ruídos reais. Em vermelho é indicado o RMSE obtido na lo-

calização usando o ML-Energia, que considera ruído aditivo sem

correlação. O método H-ML-Energia tem seus valores de RMSE

representados pela linha azul. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

9

LISTA DE TABELAS

TAB.3.1 Descrição e forma de emprego dos sinais e ruídos selecionados para

o trabalho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

TAB.3.2 Estimação de H: Filtros e escalas utilizados no estimador wavelets

para cada sinal e ruído. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

TAB.3.3 Acurácia da localização com grau de con�ança de 95% . . . . . . . . . . . . . . . 47

TAB.3.4 Valores do expoente de Hurst estimado de cada sinal e ruído acús-

tico, em ordem crescente de H. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

TAB.3.5 Estimação de H do sinal corrompido por ruído aditivo. . . . . . . . . . . . . . . 52

TAB.3.6 Resultado SRP-PHAT com ruídos reais e branco. Localização rea-

lizada por quadros de 1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

TAB.3.7 Resultado SRP-H-PHAT. Localização realizada por quadros de

1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

TAB.4.1 Resultados da distância de Bhattacharyya calculada entre os his-

togramas de erro obtidos pelo ML-Energia e pelo H-ML-Energia,

quando comparados com os histogramas de erro de localização com

ruídos reais. O tamanho do quadro considerado para este caso é o

de 1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

10

LISTA DE SIGLAS

DOA Direction of Arrival

EBL Energy Based Localization

EM Espectation Maximization

ER-NLS Energy Ratio Nonlinear Least Square

ER-NS Energy Ratio Least Square

ES Exaustive Search

fGn fractionary Gaussian noise

FLOS-FHAT fractionary Lower Order Statistics Phase Transform

GCC Generalized Cross-Correlation Function

GD Gradient Descent

INS Index of Non-Stationarity

LS Least Squares

ML Maximum Likelihood

MR Multiresolution

PHAT Phase Transform

QE Quadratic Elimination

RMSE Root Mean Squared Error

SCOT Smoothed Coherence Transform

SRC Stocastic Region Contraction

SRP Steered Power Response

TDE Time Delay Estimation

11

RESUMO

Nesta Dissertação, são estudadas soluções para melhorar a localização de fontes acús-tica quando a distorção que perturba o sistema é causada por ruídos reais, ou seja, cor-relacionados com a fonte de sinal. Dentro das técnicas de localização de fonte baseadasna estimação do retardo temporal, é proposto um método denominado SRP-H-PHAT,que utiliza a correlação existente entre sinal e ruído para melhorar o modelo de estima-ção de retardos temporais. Considerando os métodos de localização baseados em energiaacústica, é apresentado um método denominado de H-ML-Energia que considera em seumodelo, a correlação existente entre sinal e ruído.

Para avaliação dos métodos propostos, diversos sinais e ruídos acústicos são sele-cionados, com diferentes índices de não-estacionaridade. Os métodos propostos foramempregados na localização de fontes acústicas para distintos valores de razão sinal-ruído,e os resultados comparados com os métodos que apresentam melhores resultados na lite-ratura. O método SRP-H-PHAT apresentou resultados de localização mais próximos deuma situação onde os sinais são corrompidos por ruídos reais do que o método SRP-PHAT,que considera a distorção do sistema como um ruído branco. O método H-ML-Energiamostrou-se mais adequado para localização de fontes cujos sinais estão em presença deruídos reais do que o método ML-Energia, mesmo em situações onde tanto o sinal dafonte quanto o ruído acústico são altamente não-estacionários.

12

ABSTRACT

This work proposes two solutions to improve the localization of sound sources con-sidering that the system is disturbed by real noise, i.e., it is correlated with the signalsource. Regarding the source location methods based on the time delay estimation, theSRP-H-PHAT method it is proposed which considers the correlation between signal andnoise to achieve estimation improvement. The other proposal, called H-ML-Energy, alsoconsiders in its model the correlation between signal and noise to estimate the sourcelocation based on the acoustic energy.

For the evaluation experiments, several signals and acoustic noises are selected withdi�erent indices of non-stationarity. The proposed methods were employed on the locationof sound sources for di�erent values of signal to noise ratio, and the results comparedwith other methods available in the literature. The SRP-H-PHAT localization results arecloser to those obtained with signals corrupted by real noise than SRP-PHAT method,which considers the distortion of the system as white noise. Moreover, the H-ML-Energymethod was more suitable for locating sources whose signals are in the presence of realnoise than ML-Energy, even when both the source signal and the acoustic noise are highlynon-stationary.

13

1 INTRODUÇÃO

O avanço da tecnologia de sensores acústicos e de baixo custo, popularizou a sua inte-

gração em aparelhos celulares inteligentes (smartphones), tablets, computadores e outros

equipamentos eletrônicos. Este avanço impulsionou a pesquisa por métodos de localiza-

ção de fontes acústicas com aplicações em diversas áreas da ciência. Dentre as aplicações,

destaca-se o emprego da localização acústica em sistemas de sonar e radares (CARTER,

1981), em teleconferências, onde a localização de fonte é utilizada para mover a câmera

de vídeo de forma automática para a pessoa que está falando (WANG, 1997). Na sísmica,

permite a determinação da posição do epicentro de terremotos e explosões subterrâneas

(VALIN, 2003). Na robótica, é utilizada em robôs para que estes identi�quem pessoas ou

obstáculos (CHUNG, 2012). Nos sistemas de vigilância, a localização é empregada para

detectar e monitorar objetos dentro de uma determinada região (PATWARI, 2005). Na

estimação de condições climáticas (ROGERS, 2012), os princípios da localização de fontes

acústicas são adotados para determinar o per�l de temperatura e a velocidade dos ventos

de uma dada região.

As fontes acústicas reais (sinais e ruídos), podem ser dos mais variados tipos, como por

exemplo, aviões, carros, pessoas conversando, música, buzinas, armas de fogo, animais,

dentre outros. Estas apresentam diferentes características espectrais (cor do espectro de

frequência) e temporais (distribuição de amplitudes). Além disto, muitos dos sinais acús-

ticos reais são não-estacionários e impulsivos. Este é um aspecto interessante e desa�ador

para a área de processamento de sinais.

O objetivo de uma localização acústica é determinar a posição geográ�ca de uma

fonte de sinal por meio da captura de suas emissões acústicas. O principal desa�o da

área é que o sistema estime a posição da fonte de forma precisa, mesmo quando o sinal

é corrompido por ruídos acústicos reais, cujas perturbações diminuem a acurácia dos

sistemas de localização. Devido à di�culdade de se caracterizar todos os distintos tipos de

ruídos, os modelos de localização de fonte, por simplicidade teórica, consideram em sua

formulação que o ruído é descorrelatado da fonte de sinal. E, portanto, representado por

um ruído gaussiano de espectro branco. Esta restrição dos modelos é destacada como um

grande desa�o pelos autores nas principais propostas (KNAPP, 1976), (DIBIASE, 2001),

14

(LI, 2003), (SHENG, 2005) apresentadas na literatura. Apesar de ressaltarem que esta

hipótese é de grande restrição em seus modelos, os autores se limitam a utilizá-la para

obtenção de uma solução simples, baseada na teoria do limite central. No entanto, esta

restrição pode provocar severa degradação na determinação da real posição das fontes

quando submetidas a ruídos acústicos reais.

Os principais métodos de localização de fonte acústicas podem ser divididos em dois

grupos: os baseados na estimação dos retardos temporais (TDE - Time Delay Estimation)

e os baseados em energia acústica (EBL - Energy Based Localization). O primeiro grupo

abrange os métodos que utilizam em seu modelo o fato de que o som viaja a uma velocidade

�nita e constante, de modo que um sinal será recebido em instantes diferentes por sensores

posicionados em locais distintos. Da estimação do retardo que existe entre os sinais

recebidos, associado ao conhecimento das posições dos sensores, é possível, por meio de

um modelo, determinar a posição geográ�ca da fonte. O segundo grupo considera métodos

que empregam a energia do sinal para estimar a posição da fonte geradora. Isto é feito

pelo conhecimento de que a energia do sinal decai de forma inversamente proporcional à

distância que percorre. Assim, conhecendo a energia da fonte e a posição dos sensores,

um modelo é aplicável para se determinar onde no espaço está a fonte de sinal. A solução

clássica baseada na determinação do ângulo de chegada (DOA - Direction of Arrival)

(KNAPP, 1976), onde a direção de propagação do sinal é estimada e por triangulação é

determinada uma posição, demonstrou-se adequada apenas para sinais em banda estreita.

Este não se aplica ao foco deste trabalho, onde investiga-se a localização de fontes acústicas

de banda larga.

Os primeiros métodos de localização baseados em TDE, utilizavam a correlação

cruzada dos sinais recebidos por pares de microfones para a estimação do retardo tempo-

ral. Isto é possível pois a correlação de dois sinais, defasados entre si, será máxima para o

valor de intervalo igual ao da defasagem. Entretanto, a distorção dos sinais causada por

ruído aditivo degrada consideravelmente a função de correlação cruzada, di�cultando a

identi�cação do valor de máximo. Visando atenuar este problema, em (KNAPP, 1976),

foi proposta uma maneira de se calcular a função de correlação cruzada no domínio da fre-

quência. Deste modo, tornou-se possível a modi�cação da função de correlação cruzada

para uma forma mais genérica, denominada função de correlação cruzada generalizada

(GCC - generalized cross-correlation). Da necessidade de melhorar a identi�cação do

ponto de máximo da função GCC, foi proposta uma técnica denominada de transfor-

15

mação de fase (PHAT - Phase Transform) (KNAPP, 1976). Idealmente, a aplicação do

PHAT na função GCC transforma a função de correlação cruzada em um impulso unitário

centrado no valor do atraso correspondente. Este solução do PHAT para a estimação do

retardo temporal entre sinais, recebidos por um par de sensores, é interessante pois os

resultados são satisfatórios mesmo em casos onde há presença de reverberação. Contudo,

o método PHAT possui uma forte limitação: o ruído aditivo que perturba o sistema é

considerado como estacionário e descorrelatado do sinal da fonte. Esta situação pode

acarretar em resultados errôneos quando o ruído real difere desta hipótese. Após a esti-

mação dos retardos temporais, um localizador, é utilizado para inferir a posição da fonte.

Os primeiros localizadores foram propostos para uma con�guração de sensores em geome-

tria linear (HAHN, 1973), (CARTER, 1977). Porém, esta exigência o deixa mais restrito,

impossibilitando-o de empregar geometrias mais compactas. Frente a isto, foram propos-

tos algoritmos que consideram que os sensores possam ser posicionados em uma geometria

arbitrária (FANG, 1990), (CHAN, 1994). Embora os dois últimos métodos apresentem

resultados satisfatórios, o localizador proposto em (OMOLOGO, 1997), denominado de

SRP (Steered Response Power) é o que apresenta menores erros de localização dentre eles.

Em (DIBIASE, 2001), foi avaliada a integração dos métodos de estimação de retardos

PHAT com o mecanismo SRP, denominada SRP-PHAT. Os experimentos mostraram que

esta combinação apresenta bons resultados de localização, particularmente, em ambientes

internos, onde há presença de reverberação.

Os métodos baseados na energia acústica surgiram na última década, para aplicação

em ambientes abertos ou urbanos, por meio de redes de sensores sem �o. Para isto, um

modelo de atenuação de energia acústica foi descrito em (LI, 2003). Neste modelo, a

energia da fonte de sinal é relacionada com a posição dos sensores que recebem a energia

do sinal. Embora o modelo resulte em bons resultados na estimação da posição da fonte,

ele possui a mesma restrição dos métodos TDE, que consideram de que o ruído de fundo é

descorrelatado da fonte. Em (LI, 2003), são propostas duas formas de se estimar a posição

da fonte. Uma considera que a posição da fonte é obtida pela máxima verosimilhança (ML

- Maximum Likelihood) de�nida pela atenuação acústica, e esta necessita da energia do

sinal da fonte. A outra maneira, permite que a localização seja estimada sem se conhecer

a energia da fonte, através de leitura das razões das energias entre pares de sensores. Este

segundo método é resolvido pelo critério dos mínimos quadrados (LS - Least Squares),

onde a posição da fonte é obtida pelo ponto que mais se aproxima de regiões do espaço

16

de�nidas em função da con�guração dos sensores. Em (SHENG, 2005), o método ML foi

aprimorado, e estendido para o caso em que múltiplas fontes de sinal estão inseridas no

campo de sensores. Os autores mostraram que este método, denominado ML-Energia,

apresenta resultados de localização superiores em relação ao ML e aos métodos LS.

Nesta Dissertação, são propostas duas soluções para prover robustez à localização de

fonte, mesmo quando o sinal é corrompido por ruídos acústicos reais. A primeira proposta,

denominada SRP-H-PHAT, é baseada em TDE e apresenta uma nova formulação para

a função de correlação cruzada, baseada no expoente de Hurst (H) (HURST, 1951),

(MANDELBROT, 1968). O expoente de Hurst permite a representação de todos os graus

de correlação entre sequências amostrais. Adicionalmente, no modelo SRP-H-PHAT, a

correlação cruzada dos sinais e ruídos é representada por um processo fracionário gaussiano

(fGn - fractional Gaussian Noise). A segunda proposta, denominada H-ML-Energia,

aplicada ao método de localização EBL apresenta uma nova representação da função

estocástica de erro para o modelo de atenuação de energia, empregando também o fGn.

Isto possibilita que seja incluído na localização, os efeitos da correlação existente entre

sinal e ruído.

Os métodos propostos nesta Dissertação foram avaliados em diversos experimentos,

considerando seis sinais acústicos reais (Avião, Balbúrdia, Voz, Metralhadora, Helicóptero

e Motoserra) e seis ruídos reais (Carro, F16, Navio, Veiculo Militar, Míssil e Assovio),

selecionados de distintas bases de sinais acústicos. Os sinais foram corrompidos com

cada um dos ruídos, para distintos valores de razão sinal ruído (SNR - Signal to Noise

Ratio), entre 0 dB e 20 dB, com intervalos de 5 dB. Além disso, diferentes tamanhos de

quadros (1024, 2048 e 4096 amostras) foram empregados nos experimentos localização. O

critério de seleção dos sinais e ruídos foi adotado de modo a se ter uma maior divergência

de características espectrais e temporais, e assim permitir a obtenção de um cenário

distinto e mais vasto. Adicionalmente, o índice de não-estacionariedade (INS - Index

of Non-Stationarity) (BORGNAT, 2010) de cada sinal e ruído foi estimado e avaliado o

seu impacto no desempenho dos métodos de localização. Para o estudo comparativo, os

métodos SRP-PHAT e ML-Energia foram implementados, e os resultados de localização

foram obtidos e confrontados com os métodos propostos nesta Dissertação.

17

1.1 OBJETIVOS

Os principais objetivos deste trabalho são:

• Investigar a in�uência do INS dos sinais no desempenho dos métodos de localização

de fontes acústicas.

• Analisar a estrutura de correlação (H) dos sinais e ruídos acústicos reais, bem como

dos sinais quando corrompidos por ruídos reais, para distintos valores de SNR.

• Investigar a in�uência dos ruídos acústicos reais no desempenho dos métodos de

localização de fonte que consideram que o ruído é descorrelatado. Tanto os métodos

baseados em TDE quanto os EBL serão considerados para esta análise.

• Propor um método de localização de fontes acústicas baseado em TDE que leva

em consideração a correlação existente entre sinal e ruído, por meio de um novo

estimador de retardos temporais, que utiliza o expoente de Hurst em sua formulação.

• Propor um método de localização de fontes acústicas baseado em energia acústica,

que utiliza um fGn para representar a função estocástica de erro para o modelo de

atenuação de energia.

• Avaliar a robustez dos métodos propostos através do uso de sinais e ruídos acústi-

cos reais, com distintas características de correlação e não-estacionaridade, onde os

sinais são corrompidos pelos ruídos para diversos valores de razão sinal ruído.

1.2 RESULTADOS OBTIDOS

Os principais resultados e contribuições obtidos no desenvolvimento desta Dissertação

são:

• Proposta de um método de localização baseado na estimação dos retardos temporais

que considera que o ruído que distorce os sensores é correlatado com o sinal da fonte.

Os resultados obtidos dos experimentos mostram que o método proposto apresenta

resultados mais próximos aos apresentados pela localização com ruídos reais do que

o método SRP-PHAT, que considera o ruído de fundo descorrelatado.

18

• Proposta de um método de localização baseado em energia acústica que considera

que o ruído que distorce os sensores é correlacionado com o sinal da fonte. Os

experimentos realizados mostram que o método proposto apresenta resultados mais

próximos aos obtidos de uma localização com ruídos reais do que o método ML-

Energia, que modela o erro por um ruído branco.

• Constatação de que sinais com maior índice de não-estacionariedade apresentam

mais erros na sua localização do que os de menor INS.

• Constatação de que sinais com valores de INS elevados apresentam uma maior va-

riância de seu parâmetro H, quando o mesmo é analisado por quadros de curta

duração.

• Veri�cação de que a correlação existente entre sinais e ruídos acústicos reais in�u-

encia nos resultados de localização dos métodos que consideram que a distorção é

causada por ruído branco.

1.3 ORGANIZAÇÃO DA DISSERTAÇÃO

O restante deste trabalho está organizado da seguinte forma:

• Capítulo 2: Neste Capítulo, são introduzidos os conceitos fundamentais acerca dalocalização de fontes acústicas. Ainda neste Capítulo, são apresentados os princi-

pais métodos existentes de localização, onde suas características e limitações são

abordadas de forma sucinta.

• Capítulo 3: Neste Capítulo, a localização de fontes baseada em estimação de

retardo temporal é apresentada com maior profundidade. O estado da arte é apre-

sentado, bem como suas características e limitações. Em seguida, o método de

localização de fontes baseado em retardo temporal, SRP-H-PHAT, é apresentado.

Finalmente, são mostrados os resultados dos diversos experimentos realizados para

a avaliação do SRP-H-PHAT.

• Capítulo 4: Neste Capítulo, é realizado um detalhamento do ML-Energia, principal

método de localização de fontes baseado na energia acústica. Uma análise detalhada

do ML-Energia expõe suas qualidades e limitações. Em seguida, a proposta de

19

método de localização baseado em energia é apresentada e ao �nal do Capítulo, os

resultados dos experimentos realizados para avaliação da proposta são reportados.

• Capítulo 5: Finalmente, este Capítulo expõe as principais conclusões e con-

tribuições desta Dissertação. O Capítulo também resume as principais atividades

desenvolvidas e aponta sugestões para trabalhos futuros de forma a estender os

resultados obtidos neste trabalho.

20

2 LOCALIZAÇÃO DE FONTES ACÚSTICAS: CONCEITOS E

DEFINIÇÕES

A localização de fontes acústicas é um segmento da área de processamento de sinais

que tem por objetivo determinar a posição geográ�ca de uma fonte de sinal através da

captura de suas emissões acústicas. Para isto, o sinal da fonte precisa ser recebido por

sensores acústicos, cujas posições necessariamente precisam ser conhecidas pelo sistema

de localização.

Um dos grandes desa�os da área é que o sistema de localização de fontes deve apre-

sentar a estimação da posição da fonte de forma rápida, em tempo real, com robustez

e com o menor erro de precisão possível. A presença de ruídos acústicos é o principal

desa�o para a acurácia dos sistemas de localização. Outros fatores como a amostragem e

a discretização do sinal e, ainda, os modelos empregados para a estimação da posição da

fonte podem afetar a determinação da posição correta da fonte. Devido a di�culdade de se

caracterizar todos os distintos tipos de ruídos nos modelos de localização de fonte, é usual

que se considere nos modelos de localização de fontes, que o ruído seja descorrelatado

da fonte de sinal, ou seja, um ruído gaussiano branco. Porém, várias pesquisas mostram

que os ruídos acústicos reais não são gaussianos ou brancos (WEBSTER, 1993), (MING,

2007), (ZÃO, 2012). Assim, é esperado que as posições de fontes obtidas em um sistema

de localização com distorções representadas por um ruído gaussiano branco, sejam muito

diferentes quando submetidas a um ambiente onde há presença de ruído acústico real.

Uma fonte acústica pode ser qualquer objeto ou ser vivo que emita sinais como, por

exemplo, um carro ou uma pessoa. Os sensores são circuitos eletrônicos, dotados de

microfones omnidirecionais, ou seja, que permitem a captura do som de qualquer direção.

Geralmente, os sistemas são classi�cados segundo a arquitetura dos sensores em dois

tipos: conjunto de microfones em geometria �xa e rede de sensores sem �o. Os conjuntos

de microfones são construídos em uma estrutura �xa, de geometria simétrica (circular,

esférica, linear, triangular e retangular), cujos sensores são todos conectados a um proces-

sador central. Este é responsável por amostrar e digitalizar os sinais de cada microfone,

e estimar a posição da fonte. Este tipo de arquitetura, apesar de ser mais simples de se

construir, exige uma maior largura de banda do canal de comunicação, pois existe ne-

21

(a) Conjunto de sensores em geometria �xa (b) Rede de sensores sem �o

FIG. 2.1: Duas arquiteturas empregadas nos sistemas de localização de fontes acústicas.

cessidade de se transmitir todos os sinais para o processador central. Esta arquitetura

de sensores é geralmente adotada para localização em ambientes fechados ou internos.

Já em uma arquitetura de redes de sensores sem �o, os microfones são posicionados em

posições arbitrárias dentro de um campo de sensores. A comunicação é realizada entre

os sensores, que trocam informações sobre o sinal recebido e acerca de sua própria situ-

ação, como por exemplo, sua posição geográ�ca. Este ambiente de troca de informações

é conhecido como rede colaborativa, onde o processador central, embora ainda exista,

não precisa se comunicar com todos os sensores para receber suas informações. A grande

vantagem desta arquitetura é a e�ciência na comunicação, pois geralmente os sensores

realizam o processamento do sinal de forma descentralizada e transmitem apenas a in-

formação necessária, para que o órgão central possa efetuar a localização. Um requisito

dos sensores sem �o, cuja alimentação geralmente é realizada por meio de baterias, é a

necessidade de algoritmos de troca de informações e de captura de dados que sejam mais

e�cientes em termos de economia de energia (LI, 2002). Esta arquitetura de sensores é

geralmente adotada para localização em ambientes abertos ou urbanos.

A FIG. 2.1(a) ilustra a arquitetura de um conjunto de sensores organizado em ge-

ometria retangular, enquanto na FIG. 2.1(b), os sensores estão organizados em uma rede

sem �o. Nesta última con�guração, os sensores não precisam obedecer uma geometria

especí�ca.

Os métodos de localização de fontes acústicas podem ser divididos em dois grandes

grupos: os baseados na estimação do retardo temporal (TDE - Time Delay Estimation) e

os baseados na estimação da energia ou intensidade acústica do sinal (EBL - Energy Based

Localization). Independente do sistema adotado (TDE ou EBL), a localização de fontes

acústicas deve englobar duas etapas. Na primeira, é estimada a grandeza física (retardo

ou energia) de interesse, adotada pelo método de localização empregado. A segunda etapa

consiste em localizar a posição geográ�ca da fonte acústica propriamente dita.

22

Os métodos baseados em TDE (KNAPP, 1976) foram inicialmente propostos para

ambientes fechados ou internos, onde havia o interesse de localizar fontes de forma mais

precisa. Os sistemas de localização baseados em TDE geralmente utilizam arquitetura de

sensores de�nida por um conjunto de microfones em geometria �xa.

Os métodos baseados na energia acústica foram propostos mais recentemente, para

a localização de fontes acústicas em ambientes externos e mais amplos. O conceito de

EBL surgiu em um cenário de substituição dos sensores em geometria �xa pelas redes de

sensores sem �o.

2.1 LOCALIZAÇÃO BASEADA EM TDE: DEFINIÇÃO E MÉTODOS

Os sinais acústicos se propagam no espaço com uma velocidade �nita, usualmente

aproximado para 343 metros por segundo. Sendo assim, dois sensores que se encontrem

a distâncias distintas em relação a uma determinada fonte de sinal, irão receber suas

emissões acústicas em instantes diferentes. Conhecendo-se a posição relativa entre os

sensores, é possível estimar esta diferença de tempo, que é conhecida como retardo ou

atraso temporal. Por meio da combinação de várias estimações de retardos, pode-se, em

uma segunda fase, localizar geogra�camente a posição da fonte.

Considere uma fonte acústica, cuja posição geográ�ca seja dada pelo vetor rs =

(xs, ys, zs). Um sensor i, posicionado no ponto de coordenadas (xi, yi, zi), representado

pelo vetor ri irá receber o sinal da fonte com um retardo de tempo dado por

τi =|rs − ri|

c, (2.1)

onde c representa a velocidade de propagação do som. Para um par de sensores a e b,

pode-se determinar o retardo temporal relativo entre eles, τab = τa − τb. Logo,

τab =|rs − ra|

c− |rs − rb|

c. (2.2)

Por meio da combinação de várias estimações de retardos, pode-se, em uma segunda fase,

localizar geogra�camente a posição da fonte.

A estimação do retardo temporal é realizada por meio de um par de sensores, sendo

o principal método de obtenção deste retardo, a função de correlação cruzada dos sinais

recebidos em cada sensor. O valor máximo desta função ocorre exatamente no intervalo

(lag) correspondente ao retardo temporal que se deseja estimar. Sejam dois sinais digitais

23

(a) Sinal recebido no sensor a (b) Sinal recebido no sensor b

(c) Correlação cruzada entre os dois sinais

FIG. 2.2: Correlação cruzada entre dois sinais defasados de τ = 100ms. O ponto de máximo da correlaçãocorresponde ao valor do retardo entre eles.

defasados entre si, s(n) e s(n−τ), respectivamente. A função de correlação cruzada destes

sinais é de�nida por

R(k) =∞∑

n=−∞

s(n)s(n− τ + k), (2.3)

onde k é o intervalo (lag) da função de correlação cruzada e τ é o retardo temporal entre

os sinais defasados. O valor de máximo desta função é dado para k = τ , ou seja,

R(k = τ) =∞∑

n=−∞

s(n)s(n) =∞∑

n=−∞

s2(n). (2.4)

Logo, conhecendo-se o valor de máximo de uma função de correlação cruzada, pode-se

estimar o retardo existente entre dois sinais recebidos pelo par de sensores. Por exemplo,

considere um sinal recebido em dois sensores (a e b), nos instantes ta = 0 ms e tb = 100 ms,

respectivamente. A representação dos sinais recebidos em cada um destes sensores está

ilustrada na FIG. 2.2. A função de correlação cruzada dos sinais também é apresentada na

FIG. 2.2(c). Observe que o valor de máximo da função de correlação cruzada se encontra

no valor de k = −100, que corresponde ao retardo temporal entre os sinais captados pelos

sensores.

Embora a função de correlação cruzada forneça uma indicação de atraso precisa para

o caso ideal, onde não há presença de ruído, em situações reais, esta é afetada e, con-

sequentemente, acarretará em erro na estimação do retardo temporal. Além do ruído

24

acústico, em ambientes fechados ou internos, pode ocorrer a reverberação1, que faz com

que múltiplos picos ocorram na função de correlação cruzada, prejudicando a estimação

do retardo.

Com objetivo de reduzir a in�uência da reverberação e do ruído acústico, o principal

estimador de retardo temporal baseado em correlação cruzada foi proposto em (KNAPP,

1976). Neste, a função de correlação cruzada é calculada no domínio da frequência e

denominada função de correlação cruzada generalizada (GCC - generalized cross correla-

tion). O objetivo da função GCC é realçar determinados aspectos da função de correlação

cruzada, como por exemplo, facilitar a estimação do valor de máximo. Considere um sinal

temporal de uma fonte s(n), recebido por um par de sensores (a e b),

xa(n) = s(n) + wa(n) (2.5)

xb(n) = s(n+ τ) + wb(n), (2.6)

onde wa(n) e wb(n) são, por simplicidade, ruídos assumidos como estacionários e gaus-

sianos e τ denota o retardo percebido devido ao tempo necessário que o som leva para

percorrer a distância entre a fonte e o centro do segmento de reta que une os dois sensores.

A função GCC é obtida por meio da transformada de Fourier dos sinais recebidos pelos

sensores, do seguinte modo,

RGCC(τ) = F−1 {Xa(k)X∗b (k)} , (2.7)

onde Xa(k) e Xb(k) representam os sinais xa(n) e xb(n) no domínio da frequência, respec-

tivamente, F−1{.} denota a transformada inversa de Fourier e ∗ o complexo conjugado.

A RGCC(τ) apresenta características distintas de uma função de correlação cruzada con-

vencional, caso alguma ponderação seja feita no domínio da frequência, antes de se aplicar

a transformada inversa de Fourier. Esta operação é usualmente chamada de �ltragem, por

ser realizada no domínio da frequência. A transformação de fase (PHAT - Phase Trans-

form) (KNAPP, 1976), realiza uma suavização dos componentes espectrais da função

GCC, obtida através da divisão do espectro pelo seu módulo, mantendo apenas a fase do

sinal. Deste modo,

RPHAT(τ) = F−1{Xa(k)X∗b (k)

|Xa(k)Xb(k)|

}. (2.8)

1A reverberação acústica ocorre devido à existência de obstáculos que re�etem um sinal acústico.

Assim, um sensor irá receber além do sinal original, uma cópia do mesmo com um retardo devido ao

tempo entre a re�exão (KINSLER, 1982).

25

Uma característica interessante do método PHAT é que este reduz consideravelmente

a in�uência da reverberação na estimação dos retardos temporais (KNAPP, 1976), mesmo

para situações de baixo valor de SNR. No entanto, sua limitação está na formulação que

considera a descorrelação entre sinal e ruído. Ou seja, o ruído é de�nido como aditivo

gaussiano branco. Em (DONOHUE, 2007), foi proposta uma variação do método PHAT,

denominado como PHAT-β. Nesta solução é proposta uma suavização parcial do espectro

da função GCC, em função do valor de β (0 < β < 1). Uma escolha apropriada do valor

de β pode acarretar em melhora da estimação do retardo temporal. Uma outra variação

do PHAT denominada de transformação de fase baseada em estatísticas de ordens fra-

cionárias (FLOS-PHAT - fractionary Lower Order Statistics), foi proposta em (GEOR-

GIOU, 1999). O objetivo do método era melhorar a estimação dos retardos quando o

ruído que distorce os sensores é considerado impulsivo, com distribuição de amplitudes

caracterizadas por um processo α-estável (NIKIAS, 1995), (SAMORODNITSKY, 1994).

Os resultados obtidos pelos autores mostraram que o FLOS-PHAT é apenas superior ao

PHAT quando o ruído possui distribuição α-estável, e para valores de 1 ≤ α ≤ 1, 4. Esta

hipótese nem sempre é verdadeira. Sabe-se também que distribuição de amplitudes de um

ruído di�cilmente será conhecida a priori em um cenário real de localização. Além disto,

a correlação existente entre sinal e ruído também foi desprezada no método FLOS-PHAT.

A segunda etapa de um sistema de localização de fonte acústica consiste na localização

propriamente dita. Ou seja, após a estimação dos retardos temporais obtidos na primeira

etapa, deve-se obter uma estimativa da posição geográ�ca ou espacial da fonte do sinal.

Um dos primeiros métodos de localização propostos foi apresentado em (HAHN, 1973),

denominado de localizador de azimute e distância, pois foi proposto em termos de coorde-

nadas polares. Este método foi amplamente empregado em sistemas de radar e sísmicos.

A desvantagem deste localizador é a necessidade de que as fontes a serem localizadas,

estejam situadas a uma grande distância dos sensores. Além disto, o método exige que

os sensores sejam posicionados em uma con�guração linear, ou seja, sobre uma reta. O

método apresentado em (CARTER, 1977) também emprega sensores em con�guração

linear mas permite localizar fontes que estejam próximas aos sensores. Porém, para apre-

sentar bons resultados na estimação, é necessário que a con�guração dos sensores seja

simétrica, o que torna o seu emprego muito restrito a uma determinada aplicação.

Quando o conjunto de sensores é con�gurado em uma geometria arbitrária, diferente

da linear, a localização da fonte é encontrada através da interseção de um conjunto de

26

curvas hiperbólicas. Para este caso, a solução proposta em (FANG, 1990), apresenta uma

forma fechada para encontrar a posição da fonte, em função dos retardos e das posições dos

sensores. Embora a proposta apresente bons resultados, esta considera apenas o número

mínimo de leituras exigido para a localização, ou seja, 3 microfones para a localização

em duas dimensões e 4 para três dimensões. Isto signi�ca que o método não aprimora

os resultados de localização mesmo quando um maior número de sensores é utilizado

no sistema. Esta limitação foi corrigida na proposta apresentada em (CHAN, 1994).

Entretanto, este último apresenta grande degradação na localização se a posição dos

sensores não for informada precisamente. O localizador baseado na potência de resposta

direcionada (SRP - Steered Response Power) (OMOLOGO, 1997), consiste em uma técnica

de conformação de feixe (beamforming) que utiliza a informação da disposição geométrica

de um conjunto de microfones para determinar a posição espacial da fonte. Isto é obtido

através da análise dos valores da função SRP de�nida pela composição dos sinais recebidos

pelos sensores, dada por,

P (r) =M∑i=0

[τi − τi(r)], (2.9)

onde r é um vetor de posição em coordenadas cartesianas da fonte de sinal, M é o número

de pares de sensores utilizados, τi é o retardo temporal estimado entre o par de sensores

i (i = 1, 2, ...,M) e τi(r) indica o retardo temporal teórico no par de sensor i quando

a fonte está posicionada na posição r. O método SRP apresenta resultados precisos na

localização de fontes, embora exija elevado custo computacional para a busca do valor de

máximo da função.

A combinação do estimador de retardos temporais PHAT com o localizador SRP,

foi proposta em (DIBIASE, 2001) e denominada SRP-PHAT. Ao utilizar a localização

espacial determinada pela função SRP, associada à estimação dos retardos, conferida pelo

PHAT, o SRP-PHAT obtém interessantes resultados na localização acústica, mesmo em

ambientes com reverberação. No entanto, devido ao emprego do PHAT, sua principal

limitação está no fato deste considerar o ruído aditivo como descorrelatado. Além disto,

possui um elevado custo computacional na busca do máximo da função SRP. Diversos

trabalhos foram propostos no intuito de reduzir o custo computacional do SRP-PHAT,

como por exemplo, o modelo de localização híbrida em (PETERSON, 2005). Sua principal

restrição se deve ao fato de conseguir localizar apenas fontes muito próximas do conjunto

de sensores empregados no sistema. Em (DO, 2007), um algoritmo de busca baseado

27

na contração estocástica de regiões (SRC - Stochastic Region Contraction), foi proposto.

Sua ideia é de subdividir a função SRP em regiões de busca, de forma iterativa, onde

de início uma região maior é escolhida, que contém o valor de máximo global. De forma

estocástica, a cada iteração, uma nova região, de menor volume, é selecionada, de modo

que ao �nal, um menor número de buscas são necessárias para a localização da fonte.

Embora os resultado obtidos mostrem que há uma redução do custo computacional, a

base do método é o SRP-PHAT, o que faz com que o SRC herde sua mesma restrição,

quanto a hipótese de descorrelação entre sinais e ruídos.

Neste trabalho, um método de localização baseado em TDE é proposto, cujo principal

objetivo é explorar e representar a correlação entre sinais e ruídos. Para avaliar a proposta,

escolheu-se o SRP-PHAT como referência para a análise comparativa dos resultados de

localização.

2.2 LOCALIZAÇÃO BASEADA EM ENERGIA: DEFINIÇÃO E MÉTODOS

O uso da estimação da energia acústica para localização de fontes (EBL - Energy Based-

Localization), diferentemente dos métodos baseados em TDE, surgiu em um contexto de

localização em ambiente aberto. Neste sistemas, onde grandes distâncias são consideradas,

é exigida uma menor precisão na localização.

A localização de fontes através da estimação da energia, se baseia no fato de que a

intensidade do sinal acústico é atenuada à medida que se distancia da fonte geradora. Por

meio de uma função que relacione a atenuação, e que permita a estimação da energia do

sinal emitido pela fonte, é possível determinar a sua posição. A medição da energia do sinal

recebido é realizada pelos diversos microfones que se encontram em posições conhecidas

pelo sistema. A FIG. 2.3 ilustra um exemplo de localização EBL, onde uma fonte acústica

(representada pelo quadrado) está inserida em um campo de 100 x 80 metros. Para este

exemplo, 4 sensores (representada por círculos) são posicionados em con�guração espacial

arbitrária. Os asteriscos mostram as posições estimadas da fonte durante cinco testes

de localização. Apesar da vasta área do campo de sensores utilizada, percebe-se que as

estimações são próximas da posição real da fonte.

O primeiro método de localização de fontes a utilizar a energia acústica da fonte

emprega o princípio do ponto de aproximação mais próximo (CPA - Closest Point of

Approach) (LI, 2003). No CPA, a ideia básica é considerar que o sensor que apresente o

28

FIG. 2.3: Exemplo de uma localização EBL. A fonte é representada pelo quadrado vermelho. Os sensoressão indicados pelos círculos e os asteriscos ilustram as posições estimadas para a fonte a cada quadro.

maior valor de energia seja aquele que está mais próximo da fonte. Deste modo, pode-se

estimar a posição da fonte através da posição do sensor que receber o sinal da fonte de

forma menos atenuada. Para apresentar resultados satisfatórios, este método necessita

que o campo de sensores possua grande quantidade de elementos.

Ainda em (LI, 2003), foi proposto um método de localização de fontes acústicas, rela-

cionando a energia do sinal acústico da fonte com a sua posição, bem como com as

posições de cada um dos sensores. Assim, considerando uma fonte acústica única, cuja

posição varia no tempo e é representada por p(t), a energia recebida em cada sensor i,

pertencente a uma rede de N sensores, é dada por

ui(t) = gi.B(t− τi)

|p(t− τi)− ri|a+ E[w2

i (t)], (2.10)

onde, ri representa a posição (�xa) de cada sensor i, B(t) é a energia do sinal acústico

gerado pela fonte, τi é o retardo temporal devido a distância que separa a fonte do sensor

i, gi é o ganho de energia do i-ésimo sensor, a é a constante de decaimento e E[w2i (t)] é a

energia do ruído de fundo, considerado como descorrelatado e com distribuição gaussiana.

O modelo de�nido na EQ. 2.10 foi proposto em (LI, 2003), então denominado de modelo de

decaimento da energia acústica, onde a constante de decaimento foi experimentalmente

determinada (aproximadamente igual a 2). Além disto, os autores consideram que a

energia do sinal da fonte varia pouco ao longo de um quadro de localização, o que permite

que se despreze o retardo dos sinais, simpli�cando o modelo proposto. Deste modo, é

possível estimar a energia da fonte acústica, B(t), se a energia do ruído em cada sensor

for considerada com distribuição gaussiana, identicamente distribuída com média µi e

variância σi conhecidas. Logo, cada ui(t) será uma variável aleatória gaussiana com

29

função de probabilidade condicional conjunta dada por

f(u1(t), ..., uN(t)|σ2, B(t),p) ∝ exp

{−1

2

N∑i=1

ui(t)− µi − giB(t)/|p(t)− ri|2

σ2i

}, (2.11)

que corresponde a função de máxima verosimilhança (ML - Maximum Likelihood)

(CHUNG, 2012) e (PAPOULIS, 2002). Logo, maximizar esta função permite que se

estime a energia da fonte de sinais acústicos e, ao mesmo tempo, se determine sua posição

geográ�ca.

Uma segunda alternativa de localização também foi proposta em (LI, 2003), onde a

energia da fonte não precisa ser estimada para que sua posição seja determinada. Para

isto, os autores modi�caram o modelo de decaimento de energia acústica de forma a

eliminar a energia da fonte de sua formulação. Isto é obtido através da leitura de razões

de energia acústica em pares de sensores, denominado de localização por hiperesferas2 de

razões de energia (Energy Ratio Location Hypersphere). Para cada dois sensores i e j, é

tomada a razão, κij entre suas medições de energia. Se o ruído for desprezado, o modelo

do decaimento de energia tem sua forma reduzida a hiperesferas cujos centros (cij), e raios

(δij) são funções da posição da fonte acústica e dos sensores, dados por,

cij =ri − κ2ijrj1− κ2ij

, e δij =κij|ri − rj|

1− κ2ij(2.12)

Portanto, em um campo com N sensores, existem N(N − 1)/2 razões de energia

distintas, que formam N(N−1)/2 hiperesferas, cada uma com função descrita por |r(t)−cij|2 = δ2ij. Da interseção destas hiperesferas, é estimada a localização da fonte.

O modelo das razões de energia foi formulado considerando a inexistência de ruídos

ou distorção acústica. Quando o ruído passa a ser considerado, a posição da fonte deixa

de ser estimada pela interseção das hiperesferas e passa a ser dada pelo ponto de menor

distância entre todas as hiperesferas. Deste modo, a localização da fonte passa a ser um

problema de otimização, onde a função custo J(r) é expressa em termos da posição da

fonte acústica e das razões de energia acústica,

J(r) =N∑i=1

N∑j=1

||r − cij| − δ2ij|2 +N∑i=1

N∑j=1

|(ri − rj)T r −|ri|2 − |rj|2

2|2. (2.13)

2Em um plano, ou seja, em duas dimensões, uma hiperesfera é um círculo. Em três dimensões, uma

hiperesfera é uma esfera.

30

Portanto, a posição estimada da fonte será dada pelo valor de r que minimiza a função

custo J(r). Este método de localização foi denominado pelos autores de método baseado

em razões de energia de mínimos quadrados não-linear (ER-NLS - Energy Ratio Nonlin-

ear Least Square). Uma alteração da função custo foi proposta pelos mesmos autores,

onde os termos não-lineares são cancelados. Esta segunda formulação foi denominada

de método baseado em razões de energia de mínimos quadrados linear (ER-LS - Energy

Ratio Nonlinear Least Square).

Em (LI, 2004), o modelo de hiperesferas de razões é alterado, de modo a permitir que

a posição da fonte possa ser estimada por uma fórmula fechada, ou seja, sem necessidade

de minimização da função custo. Este método foi denominado de eliminação quadrática

(QE - Quadratic Elimination). Embora o baixo custo computacional seja atraente, ele

não apresenta precisão nos resultados de localização quando a razão sinal-ruído é baixa.

Em (SHENG, 2005), o modelo de decaimento da energia acústica foi estendido para o

caso em que múltiplas fontes de sinal estão presentes no campo de localização, e denomi-

nado ML-Energia. Uma função de máxima verosimilhança foi apresentada, onde de sua

maximização, pode-se estimar a energia acústica das K fontes de sinais e ao mesmo tempo

as suas posições. Mais uma vez, a principal restrição deste método, é que ele considera

em sua formulação que o ruído que distorce os sinais recebidos nos sensores é gaussiano

branco, ou seja, desconsidera a correlação existente entre sinal e ruído.

Praticamente todos as propostas de localização EBL (com exceção do QE), necessitam

encontrar o ponto de máximo ou mínimo de uma dada função para estimar a posição da

fonte de sinal. Deste modo, foram propostos alguns métodos de busca, com �nalidade de

não apenas encontrar a solução, mas também de fazê-lo com menor custo computacional

possível, tendo em vista a necessidade de economia de energia presente em uma rede de

sensores.

Para minimizar a função custo do ER-NLS e do ER-LS, foi proposto um algoritmo

de busca exaustiva (ES - Exaustive Search) (LI, 2003). Neste, uma varredura é realizada

ponto a ponto dentre as prováveis posições da fonte no campo de sensores. Apesar de ser

o de implementação mais simples, o tempo para processamento e o custo computacional

são proibitivos para um ambiente de redes de sensores sem �o. Além disto, sua precisão

depende do tamanho da área de varredura, sendo tanto maior quanto menor for esta área.

Com o propósito de reduzir o custo computacional mas ao mesmo tempo manter a

simplicidade da implementação, foi de�nida a busca em multi-resolução (MR - Multireso-

31

lution search) (LI, 2003). Neste caso, a varredura é realizada por busca exaustiva, porém,

inicialmente se emprega uma área de varredura com pontos largamente espaçados, e após

uma primeira iteração, e identi�cação do ponto de máximo, a resolução da busca é au-

mentada e uma nova busca é efetuada ao redor do ponto encontrado. O procedimento é

repetido por diversas vezes, e na iteração �nal, usa-se uma área de busca muito pequena.

A vantagem é a redução do custo computacional, porém, dependendo do valor de SNR,

pode-se selecionar um ponto incorreto na primeira varredura, levando a uma estimação

errada da posição da fonte. Para se perceber a grande vantagem da busca MR em relação

ao ES, considere uma localização de fonte em um campo de sensores bidimensional com

tamanho 100 x 100 metros. Supondo que a busca ES seja realizada em uma área de 1 x

1 metro, então serão analisados 10000 pontos. Se for empregada a busca MR com três

níveis de busca, 10 x 10 metros, seguida por 2 x 2 metros e por �m 1 x 1 metro, serão

analisados no total 100 + 4 + 1 = 129 pontos. A e�ciência computacional é ainda mais

evidente quando a localização é realizada em três dimensões.

O algoritmo de busca baseada no gradiente (GD - Gradient Descent) (LI, 2003) é uma

técnica de otimização onde a direção do mínimo da função é escolhida como a oposta ao

gradiente. Em cada iteração, a posição da fonte será dada segundo a última posição e o

gradiente da função custo,

r(k + 1) = r(k)− λ∇J(r), (2.14)

onde J(r) é a função custo, λ é o fator de convergência escolhido e∇ representa a operação

de gradiente. Deste modo, após algumas iterações, o algoritmo irá convergir para a

solução. Apesar da rápida convergência, é necessário que a posição inicial da fonte seja

escolhida de forma adequada. Para isto, recomenda-se utilizar a busca exaustiva para

gerar uma primeira estimativa da posição da fonte, para então iniciar as iterações do

método GD.

Os autores (LI, 2003) mostraram por meio de experimentos que os algoritmos de busca

baseados no gradiente e o da multi-resolução são os mais adequados para os métodos

EBL. Apesar do MR apresentar resultados levemente inferiores ao GD, ele é computa-

cionalmente menos custoso, sendo por isto, considerado como melhor dentre os dois.

Em (SHENG, 2005), como mais de uma fonte é localizada, os algoritmos de busca

foram modi�cados, sendo propostas uma técnica baseada na maximização da esperança

(EM - Expectation Maximization) e na multi-resolução. Os autores mostraram que para o

ML-Energia, o algoritmo MR apresenta melhores resultados na estimação da posição da

32

fonte do que o EM.

Uma comparação entre os principais métodos de localização de fontes acústicas

quando as mesmas possuem distintas características de impulsividade foi apresentada

em (DRANKA, 2013), onde mostrou-se que quanto mais impulsivo é um sinal, mais erros

ocorrem na estimação da posição da fonte.

Nesta Dissertação, uma proposta de método de localização EBL é apresentada, cujo

principal objetivo é explorar e representar a correção entre sinais e ruídos. Para �ns

de uma análise comparativa da proposta, o ML-Energia foi escolhido, por apresentar

melhores resultados de localização. Apesar do algoritmo de busca EM ser empregado para

maximizar a função ML-Energia, neste trabalho é utilizada a busca em multi-resolução

para a maximização, pois apresentou melhores resultados em termos de convergência, nos

experimentos.

2.3 DESAFIOS

Para os métodos baseados em TDE, o principal desa�o que existe é o fato de se con-

siderar que a distorção causada no sistema é modelada por um ruído gaussiano branco, ou

seja descorrelatado. Esta consideração leva a um modelo menos realístico, que apresenta

erros quando a localização é realizada em um ambiente com presença de ruídos reais. Os

métodos EBL sofrem desta mesma limitação, pois também consideram que a distorção

causada no sistema é modelada por um ruído branco.

2.4 RESUMO

Este Capítulo introduzir a teoria acerca da localização de fontes acústicas. Foi

mostrada a constituição de um sistema de localização de fontes, apresentando as possíveis

disposições dos sensores dentro de um campo de localização. Foram apresentadas as duas

grandes vertentes da localização acústica, que são os métodos baseados na estimação dos

retardos temporais (TDE) e os baseados na energia acústica (EBL). Suas características

e limitações foram exploradas, bem como os principais métodos existentes e o estado da

arte. Por �m, foram mostrados os métodos adotados neste trabalho para um maior apro-

fundamento e comparação com as propostas de métodos de localização de fonte, abordadas

nos Capítulos 3 e 4.

33

3 LOCALIZAÇÃO DE FONTES BASEADA NO RETARDO TEMPORAL

A localização de fontes de sinais acústicos utilizando a estimação dos atrasos temporais

é vastamente explorada na literatura. O uso do algoritmo PHAT (KNAPP, 1976) como

estimador destes retardos temporais apresenta bom desempenho em ambientes fechados

e é, portanto, incorporado às diferentes soluções de localização. Entretanto, o método

PHAT e suas vertentes, possuem uma limitação em sua formulação, pois considera que o

ruído e o sinal da fonte são descorrelatados entre si, ou seja, o ruído aditivo que distorce

os sensores é representado por um ruído gaussiano branco. Além disto, o ruído aditivo

do método PHAT é considerado como estacionário. Diversos estudos na literatura evi-

denciam que ruídos acústicos reais apresentam distribuição de amplitudes não-gaussianas

(WEBSTER, 1993), (MING, 2007), (ZÃO, 2012) e espectros coloridos. Somado a isto,

devido ao fato de que os sinais e ruídos são originados pelos mais variados tipos de fontes

acústicas, como, por exemplo, aviões, pessoas falando, música e veículos, possuem dis-

tintas características espectrais e temporais, sendo não-estacionários e não-gaussianos. A

correlação entre os ruídos e as fontes acústicas a serem localizadas, pode afetar o desem-

penho da estimação real da posição espacial ou geográ�ca destas fontes. Surge então a

necessidade de uma nova solução, que permita uma melhor localização mais apropriada

para ambientes onde a fonte de sinais é corrompida por ruídos acústicos reais.

Este Capítulo apresenta uma proposta de um método de localização de fontes de sinais

acústicos quando as mesmas são corrompidas por ruídos acústicos não-estacionários e cuja

correlação entre fonte de sinal e ruído é explorada na solução.

3.1 MÉTODO DE LOCALIZAÇÃO ACÚSTICA SRP-PHAT

A localização acústica baseada em atraso temporal é geralmente realizada em duas

etapas: estimação de retardos e localização propriamente dita. A estimação dos retardos

é realizada pelo processamento dos sinais recebidos de pares de sensores acústicos ou

conjunto de microfones. Já a localização, emprega estes retardos estimados para indicar

a posição provável da fonte acústica que emitiu os sinais (BRANDSTEIN, 1997). A

estimação dos retardos temporais baseada no método PHAT em conjunto com o método

34

de localização SRP são o estado da arte por apresentarem as melhores taxas de acerto,

considerando a descorrelação entre fontes e ruídos. O método de localização SRP-PHAT

(DIBIASE, 2001), (MORAGUES, 2008) baseia-se no processamento dos sinais recebidos

por sensores localizados em posições geográ�cas distintas e �xas. Com os valores dos

retardos estimados com o uso do algoritmo PHAT, estima-se a posição da fonte acústica

geradora dos sinais recebidos por meio de um localizador, denominado SRP.

3.1.1 ESTIMADOR DE RETARDO TEMPORAL PHAT

Apesar do método PHAT ter sido proposto originalmente para ambientes fechados,

ou seja, onde há reverberação, este trabalho avalia o seu emprego para situações onde as

fontes de sinais se encontram em um ambiente aberto (POURMOHAMMAD, 2013).

Considere um campo aberto, onde uma fonte emissora de sinal acústico é recebida,

amostrada e discretizada por dois sensores localizados em duas posições distintas,

x1(n) = s(n) + w1(n) (3.1)

x2(n) = s(n+ τ) + w2(n), (3.2)

onde x1(n) e x2(n) são os sinais recebidos nos sensores 1 e 2, respectivamente, s(n) é sinal

gerado pela fonte acústica, w1(n) e w2(n) são ruídos assumidos como estacionários, com

média zero e descorrelatados entre si e com o sinal s(n), e τ o retardo percebido devido

ao tempo necessário que o som leva para percorrer a distância entre a fonte e o centro do

segmento de reta que une os dois sensores.

Uma maneira usual de se determinar o retardo temporal τ é através da função de

correlação cruzada

Rx1x2(τ) =∞∑

n=−∞

x1(n)x2(n+ τ), (3.3)

sendo que o valor de τ que maximiza a EQ. 3.3 fornece uma estimação do retardo temporal

real, ou seja

τ = argmaxτ

Rx1x2(τ). (3.4)

A correlação cruzada entre dois sinais, no domínio da frequência, pode ser obtida

utilizando-se a convolução dos sinais resultantes da transformada de Fourier, de�nida por

F

{∞∑

n=−∞

x1(n)x2(n− τ)

}= X1(k)X∗2 (k), (3.5)

35

onde F{.} denota a transformada de Fourier, X1(k) eX2(k) representam as transformadas

de Fourier dos sinais x1(n) e x2(n), e ∗ denota o complexo conjugado. Isto signi�ca que

a função de correlação cruzada de dois sinais pode ser determinada aplicando-se a trans-

formada de Fourier inversa ao produto da transformada dos dois sinais. Considerando-se

esta propriedade, e aplicando-se na EQ. 3.1, obtém-se a correlação cruzada no domínio

da frequência (CX1X2(k)), também denominada de espectro cruzado,

CX1X2(k) = E[X1(k)X∗2 (k)]

CX1X2(k) = E[|S(k)|2ejωkτ ] + E[W1(k)W ∗2 (k)]

+E[S(k)W ∗2 (k)] + E[S∗(k)W1(k)ejωkτ ], (3.6)

onde E[.] representa o operador esperança ou expectância,W1(k),W2(k) as transformadas

de Fourier de um ruído gaussiano branco aditivo nos sensores 1 e 2 e S(k) a transformada

do sinal. Como no método PHAT assumiu-se os ruídos descorrelatados entre si e o sinal

de interesse, as três últimas parcelas da EQ. (3.6) são iguais a zero. Logo, a correlação

cruzada no domínio da frequência dos sinais x1(n) e x2(n) é a dada por,

CX1X2(k) = E[|S(k)|2ejωkτ ]. (3.7)

Segundo a propriedade citada na EQ. 3.5, é possível determinar a função de correlação

cruzada dos sinais recebidos pelos sensores calculando-se a transformada inversa do seu

espectro cruzado. Porém, para a obtenção da função CX1X2 no domínio do tempo, é

possível aplicar-se uma �ltragem nas componentes de frequência do espectro cruzado.

Esta ideia foi proposta em (KNAPP, 1976) e �cou conhecida como correlação cruzada

generalizada (GCC - Generalized Cross-Correlation Function),

RGCC(τ) = F−1 {G(k)CX1X2(k)} , (3.8)

onde RGCC(τ) é a função de correlação cruzada generalizada e G(k) representa uma

função de ponderação na frequência. Nota-se que para G(k) = 1, a função GCC é reduzida

à função de correlação cruzada habitual. Diversas propostas para a função G(k) foram

propostas na literatura, dentre eles, o processador de Roth (ROTH, 1971), a transformada

de coerência suavizada (SCOT - Smoothed Coherence Transform) (CARTER, 1973), o

�ltro de Eckart (ECKART, 1952) e a �ltragem PHAT (KNAPP, 1976). Em (KNAPP,

1976) foi mostrado que dentre todas as funções propostas, PHAT é a única que consegue

reduzir os efeitos da reverberação na função de correlação cruzada, permitindo um maior

36

isolamento do valor de máximo da função GCC, causando erros na estimação do retardo.

A função PHAT é de�nida por

G(k) =1

|CX1X2(k)|, (3.9)

que incorporada na EQ. 3.8, resulta na função GCC-PHAT,

RGCC(τ) = F−1{CX1X2(k)

|CX1X2(k)|

}, (3.10)

empregada para estimar-se retardos temporais através de,

τ = argmaxτ

RGCC(τ). (3.11)

3.1.2 LOCALIZADOR DE FONTES ACÚSTICAS BASEADO NO SRP

O método de localização SRP (OMOLOGO, 1997) consiste em uma técnica de con-

formação de feixe (beamforming) que utiliza a informação da disposição geométrica de

um conjunto de microfones para determinar a posição espacial de uma fonte. Isto é feito

através da análise dos valores de uma função espacial3 gerada pela composição dos sinais

recebidos pelos diferentes pares de sensores. De forma geral, a função SRP é de�nida por

P (r) =M∑i=0

[τi − τi(r)], (3.12)

onde r é um vetor de posição em coordenadas cartesianas da fonte do sinal,M é o número

de pares de sensores utilizados, τi é o retardo temporal estimado entre o par de sensores

i (i = 1, 2, ...,M) e τi(r) indica o retardo temporal teórico no par de sensores i quando a

fonte está posicionada na posição r.

Em (DIBIASE, 2001), o autor mostrou que a função SRP pode ser reescrita em termos

da função de GCC da seguinte forma,

P (r) = 2π

Q∑q=1

Rq(τq(r)), (3.13)

onde Q é a quantidade de pares de sensores formados da combinação dois a dois de N

sensores sem repetição4, Rq é a função GCC do par de sensores q (q = 1, 2, ...Q), e τq é

o retardo temporal teórico que seria observado pelo par de sensores q se a fonte estivesse

3Função escalar (f : R3 → R) onde as variáveis são as coordenadas cartesianas x, y, z.4Com um conjunto de N sensores é possível formar N(N − 1)/2 pares de sensores diferentes.

37

(a) (b) (c)

FIG. 3.1: Lugar geométrico dos pontos com mesmo valor da função SRP de um ponto que passe pelaposição da fonte gerada para uma fonte única e dois sensores. (a)Hiperboloide em 3D; (b)Hiperboloideem 3D cortado por um plano; (c)Hipérbole em 2D resultante do corte. Figura extraída de (VELASCO,2012).

na posição r. O localizador SRP foi proposto para uso em conjunto com o estimador

PHAT, sendo por isto, o método batizado como SRP-PHAT. Deste modo, de acordo com

o SRP-PHAT, a posição da fonte de sinal é obtida por,

r = argmaxr

Q∑q=1

Rq(τq(r)), (3.14)

cuja posição geográ�ca da fonte de sinais é estimada pelo argumento da função SRP-

PHAT onde o seu valor é máximo. A busca deste valor pode acarretar em complexidade

computacional elevada, se esta for realizada em grandes regiões de busca e se for desejada

elevada precisão. Muitos métodos foram propostos na literatura com objetivo de reduzir

o custo computacional desta busca (DO, 2007), (PETERSON, 2005).

Uma interpretação geométrica da função SRP-PHAT é apresentada em (VELASCO,

2012), que diz que para um par de sensores que recebe o sinal da fonte acústica, o lugar

geométrico dos pontos do espaço que possuem o mesmo valor da função SRP-PHAT,

ou seja, as possíveis posições da fonte de sinal, é delimitado por uma das folhas de um

hiperboloide de revolução5, cujos focos6 estão localizados nas posições espaciais de cada

um dos sensores. Isto signi�ca que, a localização de uma fonte por meio de um único

par de sensores terá in�nitas soluções. Tal situação pode ser visualizada na FIG. 3.1(a),

onde é ilustrada a posição da fonte (em vermelho) e a folha do hiperboloide que passa

pela posição da fonte, em verde, indicando todas as possíveis posições da fonte de sinal.

Se a localização foi realizada em um plano (2D), o lugar geométrico de pontos de mesmo

5Sejam a, b e c, reais e positivos, denomina-se hiperboloide de duas folhas a superfície formada pelo

conjunto de pontos P = (x, y, z), cujas coordenadas satisfazem uma equação do tipo x2/a2 − y2/b2 −z2/c2 = 1. A superfície gerada possui duas regiões distintas, e cada uma delas é denominada folha.

6Pontos considerados como referência de valores simétricos em relação aos pontos de uma curva dada.

38

(a) (b) (c)

FIG. 3.2: Lugar geométrico dos pontos com mesmo valor da função SRP de um ponto que passe pelaposição da fonte gerada para uma fonte única e dois pares de sensores independentes. (a)Hiperboloideem 3D; (b)Hiperboloide em 3D cortado por um plano; (c)Hipérbole em 2D resultante do corte. Figuraextraída de (VELASCO, 2012).

valor de SRP é reduzido a uma parábola (FIGS. 3.1(b) e 3.1(c)). Como existem in�nitas

posições para a fonte de sinal, percebe-se que a localização da fonte torna-se inviável com

apenas um par de sensores. A FIG. 3.2(a) mostra o mesmo lugar geométrico gerado agora

por dois pares de sensores distintos. Perceba que, no caso em três dimensões, a interseção

das duas folhas dos hiperboloides formam conjuntos de in�nitos pontos, não sendo ainda

possível uma solução única para a posição da fonte de sinal. Porém, considerando a

localização em duas dimensões (FIGS. 3.2(b) e 3.2(c)), as parábolas se interceptam em

um único ponto, indicando que para este caso, dois pares de sensores permitem uma

localização única pelo método SRP.

Um exemplo de função SRP em 2D é ilustrado na FIG. 3.3, onde uma fonte de sinais

é posicionada no ponto de coordenadas (2,6 ; 2,6), dentro de um plano quadrado de 5

metros de lado. O sinal da fonte é recebido por 3 sensores que se encontram dentro do

mesmo quadrado, em posições distintas. O valor de máximo da função indica a posição

espacial estimada da fonte do sinal acústico.

3.2 PROPOSTA DE LOCALIZAÇÃO DE FONTES ACÚSTICAS - MÉTODO SRP-H-

PHAT

Este trabalho propõe um novo método de localização de fontes acústicas baseado no

método SRP-PHAT. O principal objetivo é tornar a localização das fontes acústicas mais

robusta incluindo os efeitos da distorção dos ruídos reais na representação teórica.

A ideia do método proposto é incluir o grau de correlação temporal entre sinais e

ruídos, caracterizada pelo expoente de Hurst (0 ≤ H ≤ 1). Além disso, é proposta a

representação através de um fGn. Deste modo, com uma melhor representação do ruído

39

FIG. 3.3: Representação de uma função SRP gerada da leitura de 3 sensores durante a localização dosinal, cuja fonte geradora está localizada na posição (2,6 ; 2,6).

e sua correlação com o sinal, espera-se obter resultados de localização mais próximos aos

reais, do que o método SRP-PHAT, que considera a descorrelação entre o sinal e o ruído.

Os principais conceitos e de�nições envolvidas na proposta SRP-H-PHAT são abordadas

na sequência desta Seção.

3.2.1 EXPOENTE DE HURST

Seja o sinal acústico representado por um processo estocástico s(t), com função de

autocorrelação normalizada de�nida por

ρ(k) =E{([s(t)− µs])(s(t+ k)− µs}

σ2x

, (3.15)

onde µs e σ2s são a média e variância de s(t), respectivamente. O expoente de Hurst

(0 ≤ H ≤ 1) é de�nido pela taxa de decaimento de ρ(k), que possui comportamento

assintótico dado por

ρ(k) ≈ H(2H − 1)k2H−1, quando k →∞. (3.16)

O valor de H está diretamente relacionado com as características espectrais de s(t).

Conforme demostrado em (MANDELBROT, 1968), a densidade espectral de potência

(Ss(f)) de s(t), de�nida pela transformada de Fourier de ρ(k) é proporcional a f 1−2H

quando f → 0, ou seja,

Ss(f) = F{ρ(k)} ∝ f 1−2H , f → 0. (3.17)

40

Isto signi�ca que para valores H < 1/2, s(t) é predominantemente composto por altas

frequências. Para o caso H = 1/2, Ss(f) é aproximadamente constante ao longo de todo o

espectro de frequências (ruído branco). Já para os valores de H ∈ (1/2, 1], a maior parte

da energia de s(t) está concentrada nas baixas frequências.

3.2.2 ESTIMAÇÃO DO EXPOENTE DE HURST

Nesta Dissertação, para a estimação do expoente H foi adotado o método baseado em

wavelets (VEITCH, 1998). Este pode ser resumido em três passos:

a) Decomposição com wavelets: a transformada wavelet discreta (DWT - discrete

wavelet transform) é aplicada para decompor sucessivamente o sinal de entrada

em coe�cientes de detalhes (d(j, n)) e aproximação (a(j, n)), onde j representa as

escalas da decomposição (j = 1, 2, ...J) e n o índice de cada escala.

b) Estimação da Variância: para cada escala j, a variância σ2j = (1/Nj)

∑n d(j, n)2 é

calculada dos coe�cientes de detalhes, onde Nj é o número de coe�cientes disponíveis

para cada escala j. Em (VEITCH, 1998) foi demostrado que E[σ2j ] = CHj

2H−1, onde

CH é uma constante.

c) Estimação de H: uma regressão linear ponderada é empregada para obter a incli-

nação θ de xj = log2(σ2j ) versus j. Finalmente, o expoente de Hurst é estimado

por

H =(θ + 1)

2. (3.18)

Os coe�cientes de aproximação e detalhe são obtidos através de �ltros digitais especial-

mente projetados e propostos em (DAUBECHIES, 1992). Para a estimação foram imple-

mentados três diferentes �ltros de Daubechies, enunciados neste trabalho como DAUB4

(4 escalas), DAUB6 (6 escalas) e DAUB12 (12 escalas). Para este trabalho foi utilizado

o �ltro DAUB12, pois foi o que apresentou melhor precisão na estimação dos valores de

H. O estimador wavelets permite um ajuste �no da estimação limitando-se o intervalo

de coe�cientes de detalhes utilizados para a regressão linear, e portanto na estimação de

H. Um exemplo de esquema de decomposição do método wavelets é ilustrado na FIG.

3.4, que considera J = 3 escalas de decomposição. A FIG. 3.5 apresenta a etapa �nal da

estimação de H de três sinais com valores de de H iguais a 0,2, 0,5 e 0,8, respectivamente.

41

2

2 2

2

2

2d (2, )n

d (3, )n

d (1, )n

(2, )na

σ22

σ12

σ32

2

Passa−Banda

FiltroPassa−Baixa

(3, )n

(1, )na

a

Filtro

Filtro

Filtro

Passa−Banda

Passa−BaixaFiltro

Filtro

Passa−Banda

Passa−Baixa

= Decimador

= Estimador de Variância

σ2

σ2

σ2

σ2

FIG. 3.4: Decomposição de um sinal pela transformada wavelets discreta em 3 escalas.

(a) (b) (c)

FIG. 3.5: Etapa �nal do processo de estimação (regressão linear) de H de 3 sinais arti�ciais. Os valoresverdadeiros de H de cada sinal são (a)H = 0, 2, (b)H = 0, 5 e (c)H = 0, 8.

Nota-se que a regressão linear fornece o valor da inclinação θ, diretamente relacionado

com o expoente de Hurst, conforme EQ. 3.18.

3.2.3 RUÍDO FRACIONÁRIO GAUSSIANO

Um ruído fracionário gaussiano (fGn - fractional Gaussian noise) (MANDELBROT,

1968) é uma sequência de variáveis aleatórias gaussianas X1, X2, X3, ... com a seguinte

propriedade

AN =X1 +X2 +X3 + ...+XN

NH

d=X, (3.19)

onde d= representa semelhança de distribuição de probabilidade. De forma análoga, pode

ser dada em termos da variância amostral, var(XN) = NH−1var(X1), onde

var(XN) =var(X1 +X2 +X3 + ...+XN)

NE[X1](3.20)

Perceba que quando H = 1/2, as variáveis aleatórias Xi são necessariamente indepen-

dentes. A função de autocorrelação de um fGn é dada por

E[X0Xk] = RH(k) =1

2[(k − 1)2H − 2k2H + (k + 1)2H ], (3.21)

onde k é o intervalo (lag) da função de autocorrelação, H é o expoente de Hurst. Para

todos os valores de H, pode-se aproximar a densidade espectral de um fGn por SH(f) ∼Cσ2|f |1−2H , quando |f | → 0. Para o caso particular em que H = 1/2, o fGn se reduz a

um ruído branco gaussiano.

42

O processo estocástico fGn foi adotado nesta proposta para representar a correlação

existente entre o sinal da fonte a ser localizada com o ruído real que distorce os sensores.

3.2.4 ESTIMADOR DE RETARDO TEMPORAL H-PHAT

A correlação no domínio da frequência entre entre dois sinais recebidos por sensores

localizados em diferentes posições é de�nida por,

CX1X2(k) = E[X1(k)X∗2 (k)]

CX1X2(k) = E[|S(k)|2ejωkτ ] + E[W1(k)W ∗2 (k)]

+E[S(k)W ∗2 (k)] + E[S∗(k)W1(k)ejωkτ ]. (3.22)

Na técnica PHAT, a correlação entre sinal e ruído é desprezada, fazendo com que

os três últimos termos da EQ. 3.22 sejam anulados. De acordo com o método proposto

neste trabalho, tais termos não mais serão nulos, pois a correlação entre sinal e ruído será

levada em consideração. Deste modo, as parcelas relacionadas à correlação entre sinal e

ruído serão representadas por um processo fracionário gaussiano, cujo parâmetro H será

dado pelo valor do expoente de Hurst estimado do sinal recebido (sinal + ruído) em cada

sensor. O valor dos parâmetros média e variância são obtidos destes sinais.

Na proposta, o expoente de Hurst é incluído na expressão da função de correlação

cruzada. Assim, a função de correlação é representada por

CX1X2(k) = E[Xα1 (k)Xβ

2 (k)], (3.23)

onde α e β estão relacionados com o expoente de Hurst segundo

H =α + β

2, (3.24)

onde α e β representam os valores de Hurst de cada sinal recebido nos sensores 1 e 2,

respectivamente. Como o sinal recebido em cada sensor é uma versão defasada do sinal

original, é razoável considerar que α = β = H, logo, pode-se utilizar o valor deH estimado

do sinal recebido para calcular a correlação cruzada e assim, estimar-se o retardo temporal.

O método proposto então é realizado da seguinte forma: um fGn é gerado e empregado

para distorcer o sinal da fonte, representado assim, a correlação existente entre sinal e

ruído. Após isto, a função H-PHAT (EQ. 3.23) é utilizada para determinar os retardos

temporais dos sinais recebidos nos pares de sensores.

43

A principal contribuição do método proposto é permitir estimar retardos temporais

entre sinais recebidos por pares de sensores considerando a correlação entre sinal e ruído.

Além disso, estes retardos são utilizados em conjunto com o método de localização SRP

formando o método de localização denominado SRP-H-PHAT. Convém observar que,

embora para este trabalho o método de localização SRP tenha sido escolhido, o estimador

H-PHAT pode ser utilizado por qualquer outro método de localização. O uso do estimador

H-PHAT pode ser também adequado para a estimação de retardos quando as distorções

são não-estacionárias.

3.2.5 ÍNDICE DE NÃO-ESTACIONARIEDADE (INS)

O índice de não-estacionariedade (INS - index of nonstationarity) é um método tempo-

frequência proposto em (BORGNAT, 2010) para determinar, de forma objetiva, o grau

de não-estacionariedade de sinais e ruídos.

Considere um sinal de entrada x(t). O primeiro passo para o cálculo do INS é a

construção de referenciais estacionários (surrogates) de x(t). Para isto, aplica-se a trans-

formada discreta de Fourier (DFT - discrete Fourier transform) sobre x(t) e substitui-se

a fase do sinal original por uma sequência aleatória com amostras independentes e uni-

formemente distribuídas no intervalo [−π, π]. Uma versão �estacionária" de x(t) é gerada

pela transformada inversa de Fourier da sequência obtida.

O passo seguinte é comparar o sinal analisado com os seus referenciais estacionários.

Para isto, utiliza-se a distância de Kullback-Leibler (DKL) simétrica (BASSEVILLE,

1989), que compara os espectrogramas do sinal x(t) com os obtidos dos diversos refe-

renciais substitutos.

Finalmente, o índice de não-estacionariedade é de�nido como a razão entre a variância

das distâncias observadas (Θ0(j)) do sinal em análise e a média das variâncias obtidas

dos sinais referenciais (Θ1). Ou seja,

INS :=

√Θ1

〈Θ0(j)〉j. (3.25)

Para o teste de não-estacionariedade do sinal em análise, os autores de�niram um

limiar γ considerando um valor de precisão de 95%. Desta forma, o sinal é considerado

não-estacionário se o valor de INS estiver acima deste limiar. Ou seja,

INS

{≤ γ , x(t) é estacionário;

> γ , x(t) não é estacionário.(3.26)

44

3.3 RESULTADOS DE LOCALIZAÇÃO ACÚSTICA

O objetivo desta Seção é mostrar através de testes e simulações o desempenho do

método SRP-PHAT na localização de fontes na presença de fontes de ruídos reais, ou

seja, o ruído aditivo deixa de ser considerado como descorrelatado. Além disto, pretende-

se veri�car que o método proposto possibilita obter-se resultados mais próximos aos reais

se comparado com o SRP-PHAT.

3.3.1 CENÁRIO DOS EXPERIMENTOS

Diversos experimentos foram elaborados para este trabalho. Os algoritmos de localiza-

ção de fontes foram implementados utilizando linguagem C/C++. Para os testes, foram

selecionados 6 sinais e 6 ruídos acústicos reais obtidos de distintas bases, dentre elas a

base de voz TIMIT (GAROFOLO, 1993), além das bases NOISEX-927 (VARGA, 1993) e

FreeSfx8. Da base TIMIT foi escolhida uma locução feminina, para representar uma das

fontes de sinal, referida neste trabalho, como Voz. As fontes de sinais Helicóptero e Mo-

toserra foram selecionadas da base FreeSfx. O ruído acústico Assovio, obtido da mesma

base. Da base NOISEX, foram extraídas as fontes Avião, Metralhadora e Balbúrdia, em-

pregadas como fontes de sinais, enquanto que o Veículo Militar, Navio, F16 e Carro foram

utilizados como ruídos. A Balbúrdia também foi utilizada tanto como fonte de sinal como

de ruído. Todos os sinais foram reamostrados para 16 kHz e �cortados" para que tivessem

a mesma duração, de aproximadamente 30 segundos. Para isto, foi utilizado o aplicativo

�Audacity", utilizado para processamento dos sinais. Uma breve descrição de cada um

destes sinais e ruídos bem como a sua forma de emprego neste trabalho, está apresentada

na TAB. 3.1.

Para a estimação dos valores de INS, adotou-se a distância de Kullback-Leibler e 50

referenciais substitutos (surrogates) foram empregados nos experimentos. A janela mínima

escolhida (Th/T ) é a correspondente a 1024 amostras, ou seja, considerando que esta é a

menor quantidade de amostras empregadas no trabalho, o índice de não-estacionaridade

pode ser observado na mesma situação da realizada nos experimentos de localização.

O expoente de Hurst foi estimado utilizando o método wavelets, com o �ltro DAUB12

e os coe�cientes de escala adotados estão descritos na TAB. 3.2.

7Base disponível publicamente em http://www.speech.cs.cmu.edu/comp.speech/section1/data/noisex.html.8Base disponível publicamente em http://www.freesfx.co.uk/.

45

TAB. 3.1: Descrição e forma de emprego dos sinais e ruídos selecionados para o trabalho.

Nome Descrição Emprego

Voz Uma mulher falando (em inglês) em tom de conversação fonteHelicóptero Som externo de um helicóptero se deslocando fonteMotoserra Operação de uma motoserra fonteAvião Cockpit de um avião Buccaneer se deslocando a 190 nós fonteMetralhadora Metralhadora de calibre .50 realizando disparos fonteBalbúrdia 100 pessoas conversando em uma sala fonte

Veículo Militar Veículo militar Leopard se deslocando ruídoAssovio Pessoa assoviando uma música ruídoNavio Sala de operações de um navio Destroyer ruídoMíssil Míssil sobrevoando uma área ruídoF16 Cockpit de um Caça F16 a 500 nós ruídoCarro Veículo Volvo 340, a 120 km/h, em condições chuvosas ruído

TAB. 3.2: Estimação de H: Filtros e escalas utilizados no estimador wavelets para cada sinal e ruído.

Sinal Filtro e escalas

Voz DAUB12(3,10)Helicóptero DAUB12(5,7)Motoserra DAUB12(5,9)Avião DAUB12(5,10)Metralhadora DAUB12(5,10)Balbúrdia DAUB12(4,8)

Ruído Filtro e escalas

V. Militar DAUB12(5,10)Assovio DAUB12(6,9)Navio DAUB12(5,11)Míssil DAUB12(3,11)F16 DAUB12(5,10)Carro DAUB12(9,10)

Nos experimentos de localização de fonte foi adotado um plano quadrado de 10 x 10

metros. As fontes de sinais foram posicionadas de forma aleatória dentro do quadrado

e permaneceram imóveis durante a simulação. Também no mesmo plano, e em posições

aleatórias, foram posicionados três sensores, considerados ideais9, com mesmo ganho e

com recepção omnidirecional. A atenuação do sinal devido à distância propagada foi

desprezada na análise. O ruído aditivo utilizado foi inserido em cada um dos sensores,

com valores de SNR variando entre 0 dB e 15 dB, com incrementos de 5 dB. A localização

foi realizada para quadros, sem sobreposição, para os tamanhos de 1024, 2048 e 4096

amostras. Logo, para a frequência de amostragem adotada (16 kHz), a duração do menor

quadro corresponde a aproximadamente 64 ms.

A função SRP foi estimada por varredura de cada um dos pontos do plano quadrado,

espaçados em 2,14 cm, ou seja, dentro do cenário empregado, para cada localização,

aproximadamente 217 mil pontos são veri�cados durante a análise. Os retardos temporais

entre a fonte acústica e cada par de sensores são calculados considerando a velocidade do

9Um sensor é considerado ideal quando recebe o sinal com a mesma intensidade independente da

direção que o sinal é recebido.

46

som igual a 343 metros por segundo. Para cada quadro do sinal recebido, é realizada uma

estimação da posição da fonte. Neste trabalho, se a distância entre a posição estimada

e a real posição da fonte for menor do que 13 centímetros, é considerado um acerto

na estimação da posição. Este critério foi utilizado para todos os quadros e assim, é

determinada a taxa de acertos de localização, de�nida como a razão entre número de

quadros com estimação da posição correta e o número total de quadros do sinal.

Para a avaliação do método proposto, SRP-H-PHAT, a correlação entre sinal e ruído

proposta e caracterizada por um fGn, é gerada pelo método do deslocamento de ponto

médio (midpoint displacement) (BARNSLEY, 1988). Já a descorrelação entre sinal e ruído

é representado pelo ruído gaussiano branco, gerado pelo método de Box-Muller (BOX,

1958).

A TAB. 3.3 ilustra a acurácia dos resultados dos experimentos de localização para cada

valor dos quadros adotados, segundo a desigualdade de Chebyshev (PAPOULIS, 2002),

para um grau de con�ança de 95%. Para o sinal completo (30 segundos), o valor obtido

é de 0,0013, e representa a acurácia das estimações do expoente de Hurst e do INS.

TAB. 3.3: Acurácia da localização com grau de con�ança de 95%

Número de Amostras Acurácia

1024 0,0302048 0,0214096 0,015

3.3.2 ESTIMAÇÃO DO INS

Neste trabalho, investiga-se o índice de não estacionaridade dos sinais e ruídos. Estes

são classi�cados, quanto ao seu INS em três grupos: estacionários, não-estacionários e

altamente não-estacionários. Se o sinal ou ruído possui valor de INS acima do limiar de

estacionaridade, este é considerado como não-estacionário. No estudo é considerado como

altamente não-estacionário, o sinal ou ruído que apresentar valores de INS maiores que

100 vezes o seu limiar de estacionaridade. Se os valores de INS estiverem abaixo do limiar

para a maioria das janelas de análise, o sinal ou ruído é considerado como estacionário.

A FIG. 3.6 mostra o resultado da estimação do INS para os seis sinais seleciona-

dos. A primeira linha mostra, da esquerda para a direita, as fontes Avião e Balbúrdia,

sendo o primeiro classi�cado como estacionário e o segundo como não-estacionário. A

47

(a) (b)

(c) (d)

(e) (f)

FIG. 3.6: Resultado da estimação dos valores de INS dos sinais acústicos reais, (a)Avião, (b)Balbúrdia,(c)Motoserra, (d)Helicóptero, (e)Voz e (f)Metralhadora. A linha em vermelho representa os valores deINS e o tracejado em verde, os valores de limiar de estacionaridade.

linha do meio apresenta duas fontes não-estacionárias, respectivamente, Helicóptero e

Motoserra. A linha inferior ilustra as fontes Voz e Metralhadora, classi�cadas como al-

tamente não-estacionárias. Perceba que, embora Balbúrdia e Metralhadora sejam sinais

não-estacionários, enquanto o primeiro apresenta INS máximo próximo a 30 vezes o limiar,

o segundo apresenta valores da ordem de 800 vezes o seu limiar de estacionaridade.

O resultado da estimação dos valores de INS dos ruídos acústicos é apresentado na

FIG. 3.7. O mesmo critério de classi�cação adotado para as fontes foi aplicado para

classi�car os ruídos em grupos. Da FIG. 3.7, pode-se concluir que os ruídos Carro e Navio

se enquadram no grupo dos ruídos estacionários, pois os valores de INS estão abaixo

do limiar para todos os valores de Th/T . No entanto, percebe-se que os ruídos Veículo

Militar e F16, são não-estacionários. Ao grupo dos altamente não-estacionários pertencem

os ruídos Míssil e Assovio.

Os espectrogramas dos sinais e ruídos são mostrado na FIG. 3.8, onde é possível ve-

ri�car a variação do espectro de frequência ao longo do tempo de cada sinal ou ruído.

Perceba que os sinais e ruídos, cujos espectrogramas apresentam maior variação do espec-

tro são os que possuem maiores valores de INS, se enquadrando portanto, no grupo dos

48

(a) (b)

(c) (d)

(e) (f)

FIG. 3.7: Resultado da estimação dos valores de INS dos ruídos acústicos reais, (a)Carro, (b)Navio,(c)Veículo Militar, (d)F16, (e)Míssil e (f)Assovio. A linha em vermelho representa os valores de INS e otracejado em verde, os valores de limiar de estacionaridade.

não-estacionários e altamente não-estacionários. A fonte avião possui um espectrograma

constante ao longo do tempo, indicando sua estacionaridade, que pode ser veri�cada tam-

bém pelos valores de INS obtidos.

3.3.3 ESTIMAÇÃO DO EXPOENTE DE HURST

O resultado da estimação do expoente de Hurst é apresentado na TAB. 3.4. Para

facilitar a visualização, os resultados estão ordenados por ordem crescente de H.

TAB. 3.4: Valores do expoente de Hurst estimado de cada sinal e ruído acústico, em ordem crescente deH.

Sinal H

Voz 0,10Helicóptero 0,10Motoserra 0,24Avião 0,29Metralhadora 0,45

Balbúrdia 0,58

Ruído H

Assovio 0,14Veículo Militar 0,22Navio 0,41

Míssil 0,52

F16 0,67Carro 0,84

Observa-se que tanto os sinais quanto os ruídos acústicos reais selecionados neste

49

(a) Avião (b) Balbúrdia

(c) Helicóptero (d) Motoserra

(e) Voz (f) Metralhadora

(g) Carro (h) Navio

(i) Veículo Militar (j) F16

(k) Assovio (l) Míssil

FIG. 3.8: Espectrogramas dos sinais e ruídos acústicos.

trabalho possuem valores de H bem distintos e dentro da faixa entre 0,10 e 0,84, isto

indica que praticamente toda a faixa de valores de Hurst é abrangida pelos sinais de

áudio. O sinal Voz possui um valor de H muito pequeno, o que indica que o sinal é de

alta frequência. O sinal Balbúrdia apresenta um valor de H = 0, 58 , o que indica que a

mistura de sinais de voz é uma fonte de sinal de baixa frequência, ou seja, altera a faixa de

frequência original da voz. Os demais sinais possuem um valor de H < 1/2, o que mostra

50

(a) (b)

FIG. 3.9: Estimação do expoente de Hurst para as fontes (a)Avião e (b)Metralhadora, considerandoquadros de 1024, 2048 e 4096 amostras.

que os sinais acústicos selecionados não em sua maioria de alta frequência, com correlação

negativa ou anti-persistente entre as amostras. Dentre os ruídos, o Míssil possui valor

de H que corresponde a um sinal sem correlação entre as amostras, próxima a um ruído

gaussiano branco. Assovio, Veículo Militar e Navio são ruídos de alta frequência, com

H < 1/2 e no grupo dos ruídos de baixa frequência, estão o F16 e o Carro (H > 1/2).

A estimação do expoente de Hurst dos sinais e ruídos foi realizada quadro a quadro,

ao longo da duração completa (30 segundos) dos sinais e ruídos. Considerou-se o valor

de H para os três tamanhos de quadros empregados neste trabalho (1024, 2048 e 4096

amostras). Os valores de H obtidos para as fontes Avião e da Metralhadora são ilustrados

na FIG. 3.9. Percebe-se que o valor de H varia com o tempo para ambos os sinais.

Para o sinal Metralhadora (FIG. 3.9(f)), que é altamente não-estacionário, a variação do

expoente de Hurst é muito maior que a observada para o Avião (FIG. 3.9(a)), que é uma

fonte de sinal estacionário.

Finalmente, levando em consideração que a localização de fontes acústicas é realizada

com o sinal da fonte corrompido com o ruído, deve-se estimar também os valores de

H destes sinais acústicos corrompidos para os diferentes valores de SNR. A TAB. 3.5

apresenta o resultado da estimação dos valores de H. Perceba que dentre os ruídos

selecionados para este teste, (vide a TAB. 3.4), Veículo Militar possui um valor de H

= 0,22, indicando que o ruído é de alta-frequência, o ruído Carro é caracterizado como

de baixa-frequência pois seu valor de H foi estimado em 0,84. O ruído Míssil teve o

parâmetro de Hurst estimado em 0,52, indicando que o mesmo possui um comportamento

muito próximo a de um ruído branco ou descorrelatado.

Também é possível notar que os valores de H da fonte são afetados pelos ruídos,

principalmente para os valores menores de SNR, e sofrendo menor in�uência para elevadas

SNR, onde predomina o H do sinal sem distorção. Este resultado é interessante pois

51

mostra que a correlação entre sinal da fonte e o ruído depende não só do tipo de ruído

que distorce o sinal mas também da intensidade deste ruído.

TAB. 3.5: Estimação de H do sinal corrompido por ruído aditivo.

Fonte H do sinal SNRV. Militar Míssil Carro(H = 0,22) (H = 0,52) (H = 0,84)

H (sinal + ruído)

Balbúrdia 0,58

0dB 0,45 0,46 0,755dB 0,50 0,49 0,6910dB 0,51 0,51 0,6115dB 0,52 0,53 0,55

Avião 0,29

0dB 0,27 0,39 0,765dB 0,26 0,35 0,6910dB 0,26 0,29 0,6015dB 0,26 0,27 0,48

Motoserra 0,24

0dB 0,28 0,37 0,755dB 0,30 0,36 0,7110dB 0,33 0,34 0,6415dB 0,34 0,36 0,56

Voz 0,10

0dB 0,21 0,21 0,835dB 0,18 0,16 0,8010dB 0,16 0,14 0,7515dB 0,13 0,12 0,67

3.3.4 RESULTADO DA LOCALIZAÇÃO DO SRP-PHAT COM RUÍDOS REAIS E

RUÍDO DESCORRELATADO

O objetivo deste experimento é veri�car o impacto da correlação entre as fontes de

sinais e ruídos reais no método SRP-PHAT. Para isto, os experimentos foram realizados

da seguinte forma: para um determinado conjunto de posições de fonte e sensores, foram

feitas localizações usando o método SRP-PHAT com ruído branco (descorrelatado) e com

ruídos reais. As localizações foram feitas quadro a quadro, sendo que para cada sinal,

472 quadros de localização foram estimados, para o caso em que o tamanho do bloco é

de 1024 amostras. Também foram realizados experimentos com quadros de 2048 e 4096

amostras.

Os resultados da localização (taxas de acerto) considerando tamanho de quadro de

1024 amostras são apresentados na TAB. 3.6. Cada fonte acústica foi corrompida por

seis ruídos reais e ruído branco sintético (método SRP-PHAT). O localizador adotado

foi o método SRP. A taxa de acertos da localização é mostrada sob a forma percentual.

Para facilitar a visualização, foram negritadas as taxas de acertos, na TAB. 3.6, onde a

localização com ruídos reais apresentou maior diferença se comparada com a localização

com ruído branco.

52

TAB. 3.6: Resultado SRP-PHAT com ruídos reais e branco. Localização realizada por quadros de 1024amostras.

Fonte SNRTaxa de Acertos (%) quando corrompido por:

Branco V. Militar Míssil Carro Navio Assovio F16 Balbúrdia Média

Balbúrdia

0dB 12,50 57,20 32,63 54,03 26,06 44,28 8,05 0,21 31,785dB 28,81 69,07 54,24 65,68 63,35 59,32 36,02 23,31 53,0010dB 60,38 72,67 65,04 69,92 81,57 68,64 63,35 66,95 69,7315dB 91,56 85,28 68,86 91,10 86,44 70,76 73,73 72,88 78,43Média 48,71 71,05 55,19 70,18 64,35 60,75 45,29 40,84 -

Avião

0dB 33,90 88,77 68,22 93,86 68,22 91,74 41,10 59,96 73,125dB 78,60 93,43 84,75 95,76 84,96 95,34 76,69 84,11 87,8610dB 96,61 95,97 93,22 97,03 93,86 95,76 91,31 93,01 94,3115dB 98,73 97,67 96,19 97,03 96,82 97,46 95,97 95,55 96,67Média 76,96 93,96 85,59 95,92 85,96 95,07 76,27 83,16 -

Helicóptero

0dB 11,23 86,65 59,11 89,83 44,49 77,54 16,74 37,08 58,785dB 39,83 93,01 77,54 93,43 75,21 90,25 49,36 73,52 78,9010dB 74,36 95,13 90,68 94,70 90,47 93,86 77,33 90,89 90,4415dB 91,10 95,97 93,43 95,34 93,64 95,34 90,04 94,07 93,98Média 54,13 92,69 80,19 93,33 75,95 89,25 58,37 73,89 -

Motoserra

0dB 16,95 87,08 60,17 89,62 58,26 82,42 29,45 54,66 65,955dB 53,81 92,16 77,75 91,53 84,53 87,50 62,50 76,69 81,8110dB 80,72 93,43 88,14 93,64 92,37 91,31 83,69 87,29 89,9815dB 94,70 94,28 90,89 93,43 94,07 93,01 89,62 91,74 92,43Média 61,55 91,74 79,24 92,06 82,31 88,56 66,31 77,60 -

Voz

0dB 11,86 43,64 29,87 46,82 23,52 40,04 15,04 27,33 32,325dB 27,33 48,52 40,25 52,12 40,04 48,31 31,36 40,89 43,0710dB 40,25 50,42 49,15 54,45 52,33 53,81 44,70 50,21 50,7315dB 49,79 52,54 53,39 55,93 56,14 56,36 52,33 55,72 54,63Média 32,31 48,78 43,17 52,33 43,01 49,63 35,86 43,54 -

Metralhadora

0dB 7,20 22,46 17,37 24,36 9,32 25,00 9,11 9,96 16,805dB 15,04 27,54 23,52 29,24 20,97 26,69 14,62 17,16 22,8210dB 22,25 29,24 27,33 30,93 32,20 29,03 22,46 25,85 28,1515dB 32,42 29,66 29,03 31,78 36,23 31,57 29,66 29,45 31,05Média 19,23 27,22 24,31 29,08 24,68 28,07 18,96 20,60 -

Os resultados mostram que há uma grande variação na taxa de acertos de localização

de fontes corrompidas por ruídos reais quando comparadas com as taxas obtidas para

o ruído branco. Isto demonstra o quanto a correlação entre o sinal e ruído pode afetar

a localização. A fonte Balbúrdia apresentou uma taxa de acertos de 28,81% quando

submetida a um ruído descorrelatado para SNR de 5 dB. Ao ser corrompida pelo ruído

Navio, sob mesma SNR, a taxa de acerto obtida é de 63,35%, uma diferença de 34,54%.

Mesmo para valores mais elevados de SNR (15 dB), onde o ruído tem menor in�uência,

a diferença ainda é elevada, alcançando 22,70% para o ruído Míssil e 20,80% quando a

distorção é causada pelo ruído Assovio. Percebe-se ainda que para a SNR de 15 dB, o

ruído Míssil é o que resulta em menor taxa de acerto dentre os demais ruídos. Este fato

pode ser explicado pelo seu elevado valor de INS, como mostrado na FIG. 3.7.

Analisando o caso da fonte Voz, altamente não-estacionária, veri�ca-se que de modo

geral, as taxas de acerto são bem menores que as obtidas para as demais fontes. Por

53

exemplo, a média de acertos para SNR de 15 dB não chega a 55,00%, em contraste com

a da fonte Avião, estacionária, que atinge 96,67%. Vale ressaltar que para o sinal Voz,

também se nota a diferença entre a localização com distorção causada por ruídos reais

e quando considera-se a situação original de descorrelação (ruído branco). O caso em

que a SNR é 0 dB e ruído descorrelatado, resulta em 11,86% de acerto, sendo que para

uma distorção adicionada pelo Carro, faz com que a taxa de acertos seja de 46,82%, uma

diferença de 34,96%.

Pode-se notar que todos os resultados de localização com ruídos reais diferiram dos

obtidos com ruído descorrelatado. Observou-se que fontes consideradas como muito não-

estacionárias (Voz, Metralhadora) são mais difíceis de se localizar, ao contrário das fontes

estacionárias (Avião), onde foram obtidas as maiores taxas de acerto.

Os resultados de localização obtidos para os tamanhos de quadros N = 2048 e N =

4096 estão ilustrados na FIG. 3.10, cuja taxa de acertos foram obtidas por todos os

valores de SNR para as fontes Motoserra, Balbúrdia e Avião. O eixo das ordenadas de

cada curva representa o ruído utilizado para corromper a fonte, conforme legenda da

própria �gura. A linha tracejada é a média da taxa de acertos observada na localização

quando o ruído é considerado descorrelatado e as linhas em vermelho, representam a taxa

de acertos de localização considerando distorções causadas pelos ruídos reais. A primeira

observação que se faz quanto aos resultados é que a localização das fontes considerando

ruídos reais continua diferindo dos obtidos quando o ruído é descorrelatado, mesmo para os

quadros maiores usados na localização. Por exemplo, para a fonte Motoserra corrompida

com ruído Carro, observou-se 20,00% de diferença dos resultados da localização com

ruído descorrelatado. A fonte Avião, considerada estacionária, adicionada ao mesmo ruído

resultou em uma diferença menor, inferior a 10,00%. Balbúrdia apresentou resultados

intermediários, 18,00% para o caso em que o ruído Carro era empregado. Apesar de

Balbúrdia e Motoserra serem não-estacionários, o segundo foi classi�cado como altamente

não-estacionário. Destes resultados, pode-se perceber que houve signi�cativa melhora

nos resultados de localização para as três fontes, porém, a diferença de valores obtidos

considerando-se ruídos reais e o ruído descorrelatado continua evidente. Nota-se também

que o aumento da taxa de acertos acompanhou o aspecto da não-estacionaridade, sendo

que a fonte mais não-estacionária, Motoserra, apresentou menor melhora de resultados se

comparados com as outras duas fontes.

54

(a) (b)

(c) (d)

(e) (f)

FIG. 3.10: Resultado da localização de fonte usando método SRP-PHAT e SRP com ruídos reais. Aslinhas em azul indicam a média de acertos de localização. As linhas em vermelho são as médias de acertosobtida considerando ruído descorrelatado. A �gura ilustra a média de acertos de localização das fontesMotoserra (a) e (b), Balbúrdia (c) e (d) e Avião (e) e (f). Os grá�cos (a), (c) e (e) mostram o resultadocom blocos de 2048 amostras, já (b), (d) e (f) apresentam-no para a localização realizada com quadrosde 4096 amostras.

3.3.5 RESULTADOS DE LOCALIZAÇÃO COM O MÉTODO PROPOSTO SRP-H-

PHAT

Os experimentos realizados para validar a proposta deste trabalho foram implementa-

dos considerando o mesmo cenário mencionado para a análise do SRP-PHAT. O principal

objetivo do método proposto é avaliar o desempenho do método na localização de fontes

na presença de ruídos reais.

55

TAB. 3.7: Resultado SRP-H-PHAT. Localização realizada por quadros de 1024 amostras.

Fonte SNRTaxa de Acertos (%) quando corrompido por:

Branco V. Militar Míssil Carro Navio Assovio F16 Balbúrdia Média

Balbúrdia

0dB 12,50 11,86 9,75 5,72 11,65 12,29 5,72 9,11 9,445dB 28,81 30,08 25,42 23,94 31,14 29,45 23,94 26,06 27,1510dB 60,38 61,44 58,47 61,44 64,19 60,17 62,29 62,71 61,5315dB 100,00 85,59 84,96 87,50 86,65 86,23 88,77 88,14 86,83Média 50,42 47,25 44,65 44,65 48,41 47,03 45,18 46,50 -

Avião

0dB 33,90 44,92 41,31 25,00 38,14 43,64 23,94 29,24 35,175dB 78,60 84,11 84,32 77,54 80,51 82,20 76,48 77,12 80,3310dB 96,61 96,19 97,67 95,76 96,61 95,34 95,13 94,49 95,8815dB 98,73 98,52 99,15 97,46 98,31 97,88 97,46 97,46 98,03Média 76,96 80,93 80,61 73,94 78,39 79,77 73,25 74,58 -

Helicóptero

0dB 11,23 20,76 19,07 7,84 14,62 16,74 8,26 12,71 14,295dB 39,83 49,58 47,88 36,44 44,28 45,13 32,63 41,74 42,5210dB 74,36 79,66 75,42 75,42 76,06 75,00 71,61 75,64 75,5415dB 91,10 91,31 90,04 91,74 90,25 91,74 90,68 90,68 90,92Média 54,13 60,33 58,10 52,86 56,30 57,15 50,79 55,19 -

Motoserra

0dB 16,95 26,69 23,73 17,37 21,61 22,46 13,56 16,10 20,225dB 53,81 60,17 56,57 53,81 57,20 59,11 50,42 56,36 56,2310dB 80,72 86,02 83,47 81,57 81,99 84,53 85,17 83,26 83,7215dB 94,70 94,92 94,70 94,07 93,86 94,92 95,76 94,49 94,67Média 61,55 66,95 64,62 61,71 63,67 65,25 61,23 62,55 -

Voz

0dB 11,86 15,25 16,53 8,47 12,50 12,71 10,38 9,75 12,235dB 27,33 29,87 31,99 22,67 28,18 27,54 23,94 26,48 27,2410dB 40,25 43,64 43,86 39,19 42,80 44,07 38,77 41,95 42,0415dB 49,79 53,39 54,45 51,69 53,81 53,39 52,75 53,18 53,24Média 32,31 35,54 36,71 30,51 34,32 34,43 31,46 32,84 -

Metralhadora

0dB 7,20 8,90 8,69 5,30 9,96 7,63 6,99 6,99 7,785dB 15,04 18,64 17,58 15,04 18,22 14,62 11,86 17,80 16,2510dB 22,25 27,75 25,42 25,85 25,00 23,94 21,61 27,33 25,2715dB 32,42 33,26 35,17 34,53 33,69 31,14 31,57 34,96 33,47Média 19,23 22,14 21,72 20,18 21,72 19,33 18,01 21,77 -

A TAB. 3.7 apresenta os resultados obtidos pelo método SRP-H-PHAT para o tamanho

de quadros N = 1024. Nos experimentos, cada ruído real foi representado por um processo

fGn com parâmetro H estimado do sinal recebido pelo sensor (sinal + ruído), assim como

a média e variância. Este procedimento foi realizado com todas as fontes com cada um

dos seis ruídos previamente mencionados. Além de variar o parâmetro de Hurst do fGn,

diferentes valores de SNR foram empregados.

Os resultados demonstram que o método proposto apresenta as taxas de acerto bem

mais próxima as de uma localização com ruídos reais do que o SRP-PHAT, que considera

a descorrelação entre sinal e ruído. Isto signi�ca que a correlação existente entre sinal e

ruído não pode ser desprezada, como é feito no método SRP-PHAT. A fonte Balbúrdia

quando corrompida pelo ruído F16, a um valor de SNR de 10 dB obteve uma taxa de

acerto de 63,35%, e para esta mesma situação, o SRP-H-PHAT com fGn, apresenta uma

taxa de 62,29%, uma diferença de apenas 1 ponto percentual. Já com ruído branco,

este valor cai para 60,38%, elevando a diferença em quase 3 pontos percentuais. A fonte

56

Avião corrompida com Veículo Militar, SNR de 10 dB, apresentou uma taxa de acerto

de 95,97%, sendo que para o método proposto, a taxa obtida é de 96,19%, ou seja, mais

próxima do real do que o método que considera o ruído branco, que obteve para este

caso, uma taxa de 96,61%. A fonte Voz, considerada como altamente não-estacionária,

apresentou uma taxa de acertos igual a 55,72% quando corrompida pelo ruído Balbúrdia,

para o valor de SNR de 15 dB. O método SRP-PHAT, para esta mesma situação, obteve

uma taxa de 49,79%, uma diferença de 5,93%. O método proposto gerou uma taxa de

acertos de 53,18%, uma diferença de 2,54% entre o valor obtido pelo ruído real. A fonte

Metralhadora, cujo sinal é considerado o mais não-estacionário dentre os demais, quando

corrompida com o ruído Míssil, classi�cado como altamente não-estacionário, a um valor

de SNR de 5 dB, resultou em uma taxa de acertos de 17,58% pelo método SRP-H-PHAT,

e 15,04% com o SRP-PHAT, ou seja, a diferença entre a localização com o ruído real foi

de 5,94% e 8,48%, respectivamente, onde percebe-se novamente que o resultado obtido

pelo método proposto é mais próximo do que o SRP-PHAT.

Dos experimentos com quadros de N = 2048 amostras, os resultados obtidos estão

mostrados nas FIG. 3.11. As curvas ilustram a média das taxas de acertos para cada

fonte, também nesta situação, em função da razão sinal-ruído. Esta média foi calculada

dentre todas as taxas de acertos obtidas da localização de uma fonte com todos os seis

ruídos. Os resultados demonstram que o método proposto permite localizar as fontes de

sinal de forma mais próxima a de uma localização com ruídos reais, do que quando o ruído é

considerado como descorrelatado. A fonte Voz, altamente não-estacionária, apresentou um

resultado favorável em relação ao método proposto, mantendo uma diferença de quase 10%

do SRP-PHAT para todos os valores de SNR abaixo de 15 dB. O mesmo comportamento

pode ser observado na fonte Balbúrdia, apesar da diferença ser um pouco menor do que no

caso da Voz. Novamente, isto pode ser explicado pelo fato de Balbúrdia possuir menores

valores de INS do que a Voz. Observa-se que para a fonte Avião, a média das taxas de

acerto de ambos os métodos �caram muito próximas. Isto se deve ao fato de que esta

fonte é estacionária e possui um valor de H próximo ao de um sinal gaussiano branco,

para o qual o SRP-PHAT foi proposto originalmente. Os testes também con�rmaram que

a não-estacionaridade também está relacionada com o desempenho da localização, pois

nota-se que quanto mais não-estacionário é uma fonte de sinal, mais erros ocorrem na

sua localização. Isto pode ser percebido através da análise dos valores da taxa de acertos

das fontes. Por exemplo, a fonte Avião possui média de acertos superiores a 80% para

57




FIG. 3.11: Comparação entre localização obtida pelos métodos SRP-PHAT e SRP-H-PHAT com quadrosde N = 2048 amostras. A linha em azul mostra o resultado médio obtido na localização das fontes quandoo ruído real é empregado. Já o traço em verde representa a meta que se deseja alcançar no método delocalização.

valores de SNR de 0 dB, que é a pior situação considerada nos experimentos. Para este

mesmo valor, a fonte Helicóptero apresenta taxa de apenas 32% enquanto as duas mais

não-estacionárias, Voz e Metralhadora não acertam mais de 25% e 20%, respectivamente.

Com relação aos resultados para o tamanho de quadro de N = 4096, apresentados na

FIG. 3.12, observa-se para alguns casos, a diferença de resultados obtidos pelo SRP-PHAT

comparados com os do método proposto, aumenta de forma signi�cativa. Isto pode ser

observado para a fonte Balbúrdia. Nota-se que a fonte Avião apresenta uma elevada média

de taxa de acertos para o tamanho de quadro maior. Embora de forma menos expressiva,

este aumento da taxa de acertos também ocorre nas demais fontes. Isto mostra que o

aumento do tamanho de quadros, ou seja, da quantidade de amostras observadas de um

sinal, é possível melhorar o desempenho dos métodos de localização. Além disto, percebe-

se que este aumento depende também do índice de não-estacionaridade das fontes, pois as

fontes com um maior valor de INS apresentaram um menor aumento na taxa de acertos

com relação às fontes de menor INS.

58




FIG. 3.12: Comparação entre localização obtida pelos métodos SRP-PHAT e SRP-H-PHAT com quadrosde N = 4096 amostras. A linha em azul mostra o resultado médio obtido na localização das fontes quandoo ruído real é empregado. Já o traço em verde representa a meta que se deseja alcançar no método delocalização.

3.4 RESUMO

Este Capítulo apresentou o principal método de localização de fontes acústicas da

literatura, baseado em TDE, SRP-PHAT, sendo mesmo de�nido matematicamente e sua

principal limitação foi exposta. Com �nalidade de melhorar o método SRP-PHAT, foi pro-

posto um método de localização que utiliza o expoente de Hurst para modelar a correlação

existente entre sinal e ruído. Diversas simulações foram realizadas, onde mostrou-se que

o método SRP-PHAT difere muito em seus resultados quando comparado a localiza-

ção obtida por ruídos reais. Por �m, mostrou-se também que o método SRP-H-PHAT

apresentou resultados mais próximos ao obtido por localização de fontes reais, do que o

localizador SRP-PHAT.

59

4 LOCALIZAÇÃO DE FONTES BASEADA EM ENERGIA ACÚSTICA

Os métodos de localização de fontes baseados em medições de energia ou intensidade

acústica consideram que um sinal acústico emitido por uma fonte tem sua energia atenuada

em função da distância que separa a fonte do receptor. Logo, é possível se relacionar as

posições de vários sensores com a energia recebida e obter-se a localização espacial da

fonte geradora do sinal.

O primeiro método de localização baseado em energia foi proposto em (LI, 2003),

com uso de rede sensores sem �o para a localização de fontes acústicas. O principal

objetivo era de localizar fontes de sinais em ambiente aberto ou urbanos. A con�guração

dos sensores da rede de sensores sem-�o é do tipo ad-hoc10. Isto signi�ca que, embora

a posição dos sensores da rede tivesse que ser conhecida a priori, estes poderiam estar

dispostos em qualquer con�guração, diferentemente do que acontece, por exemplo, em

um conjunto de microfones, muito empregado nos métodos de localização baseados em

retardo temporal. Na localização em campo aberto, diferentes fatores podem degradar os

resultados de localização tais como, a ocorrência de reverberação na área onde a fonte e os

sensores estão inseridos causada por construções e rochas, o impacto causado pela direção

do vento (LI, 1994). A presença de vegetação densa no local, a imprecisão na determinação

das posições dos sensores, o fato de fontes acústicas reais não serem omnidirecionais e forte

ruído de fundo presente em ambientes externos.

Apesar de saber que o ruído de fundo é um fator impactante na acurácia da localização

com método baseado em EA, considera-se, por simplicidade, que o ruído que distorce o

sistema é descorrelatado do sinal. No entanto, conforme demonstrado no Capítulo 3, a

localização de fonte é degradada quando seu sinal é corrompido por ruído real, ou seja,

correlatado com o sinal.

Neste Capítulo é proposto e analisado um método de localização de fontes de sinais

acústicos baseado em medições de energia, que considera que os sensores são corrompidos

por ruídos acústicos não-estacionários e correlacionados com a fonte de sinal. Com isto,

pretende-se superar uma das limitações do método original, tornando a localização das

10Rede onde os seus componentes trocam informações entre si, sem precisar de um agente central para

isto.

60

fontes acústicas mais robusta.

4.1 MÉTODO ML-ENERGIA

O método de localização de múltiplas fontes baseado na máxima verosimilhança

de medições de energia acústica (Maximum Likelihood Multiple-Source Localization Us-

ing Acoustic Energy Measurements), aqui abreviado por ML-Energia, foi proposto em

(SHENG, 2005), com objetivo de localizar múltiplas fontes em ambiente aberto. O uso da

máxima verosimilhança é caracterizado por propriedades estatísticas ótimas e apresenta

robustez em cenários de baixa razão sinal-ruído, mesmo quando as fontes de sinal estão

posicionadas muito próximas (CHUNG, 2012). No Capítulo 2, diversos métodos propos-

tos baseados em EBL foram apresentados, sendo ao �nal, o ML-Energia indicado como

o de melhor resultado dentre os demais. Por este motivo, ele foi selecionado para este

trabalho como referência, e um maior detalhamento é apresentado na sequência.

Seja um campo aberto, sem obstáculos e com velocidade do vento constante e uni-

forme v onde K fontes de sinais acústicos estão posicionadas. Neste ambiente, são in-

seridos L sensores de energia, cada um com a posição espacial conhecida e dada por ri

(i = 1, 2, ..., L). A amplitude de um sinal acústico que se propaga de forma omnidire-

cional, se atenua a uma taxa inversamente proporcional a distância entre fonte e receptor

(KINSLER, 1982). Assim, o sinal recebido em cada um dos L sensores é dado por

xi(n) = Ai(n) + wi(n), (4.1)

onde

Ai(n) = λi

K∑j=1

sj(n− τji)|pj(n− τji)− ri|

(4.2)

é a amplitude medida no i-ésimo sensor devido a contribuição das K fontes de sinais. O

vetor pj representa as coordenadas da posição espacial da fonte j (j = 1, 2, ..., K), wi(n)

é o ruído, modelado como descorrelatado e gaussiano de média nula e variância Σ2i . A

amplitude de cada fonte de sinal j é representada por sj(n − τji), sendo τji o retardo

temporal devido ao tempo de propagação da fonte j para o sensor i. λi é o ganho do

61

sensor i. A energia acústica, é de�nida como E[x2i (n)] = ui(t), ou

ui(t) = λ2i .

K∑j=1

E[s2j(n− τji)]|pj(t− τji)− ri|a

+ E[w2i (t)] + 2E[Ai(t)wi(t)] (4.3)

ui(t) = gi.

K∑j=1

Bj(t− τji)|pj(t− τji)− ri|a

+ E[w2i (t)] + 2E[Ai(t)wi(t)] (4.4)

onde, Bj(t) é a energia do sinal acústico gerado pela fonte j, gi é o ganho de energia do

i-ésimo sensor, a é a constante de decaimento da energia, geralmente aproximado para 2

(LI, 2003). Nota-se que o termo cruzado E[Ai(t)wi(t)] é igual a zero, pois o modelo do

ML-Energia supõe que sinal e ruído são descorrelatados entre si.

Como as medições de energia são realizadas em quadros de N amostras dos sinais

recebidos em cada sensor e, considerando que os retardos temporais in�uenciam pouco

na variação de energia dentro de um período de curta duração, os autores aproximam

Bj(t − τji) para Bj(t) e pj(t − τji) para pj(t). Assim, a EQ. 4.4 torna-se mais concisa e

o sinal de energia recebido em cada sensor ui(t) é

ui(t) = gi

K∑j=1

Bj(t)

d2ij(t)+ εi(t) (4.5)

onde dij(t) = |pj(t) − ri| é a distância Euclidiana que separa a fonte j do sensor i e

εi(t) representa a energia do ruído aditivo. No ML-Energia, εi(t) é representado por uma

distribuição gaussiana, com média µi = Σ2i e variância σ

2i = 2Σ4

i /N , sendo N a quantidade

de amostras de um quadro do sinal utilizado para estimar a energia. Com o objetivo de

reescrever as medições de energia acústica ui(t) em termos de uma função densidade

de probabilidade condicional dos parâmetros desconhecidos (posição das fontes e suas

energias), para todos os sensores considerados, foram de�nidas as seguintes matrizes,

Z =[

u1−µ1σ1

... uL−µLσL

]TG = diag

[g1σ1

g2σ2

... gLσL

]

D =

1d211

1d212

... 1d21K

1d221

1d222

... 1d22K

......

. . ....

1d2L1

1d2L2

... 1d2LK

62

B =[B1 B2 ... BK

]TH = GD

ξ =[ε1 ε2 ... εL

]T, (4.6)

onde Z representa a matriz das leituras de energia normalizadas, G é a matriz de ganhos,

D a matriz de atenuações, B indica a matriz de energia acústica das fontes e ξ representa

a matriz de erro.

Assim, pode-se reescrever a EQ. (4.5) como

Z = GDB + ξ. (4.7)

A função densidade de probabilidade conjunta de Z pode ser expressa, na forma ma-

tricial, por

f(Z|θ) = (2π)−N/2exp{−1

2(Z−HB)T (Z−HB)} (4.8)

onde,

θ =[

pT1 pT2 ... pTK B1 B2 ... BK

]T(4.9)

é o vetor que contém a posição pj de cada fonte e sua respectiva energia Bj. Aplicando-se

o logaritmo na EQ. 4.8, obtém-se a função de máxima verossimilhança a ser minimizada

(CHUNG, 2012), expressa por

L(θ) = ||Z−GDB||2. (4.10)

Note que a EQ. 4.10 é não-linear e possui K(p + 1) parâmetros desconhecidos, onde

p é a dimensão do vetor de coordenadas pk, o que exige um mínimo de K(p + 1) sen-

sores no campo de localização para obter-se uma solução única. O algoritmo proposto

por (SHENG, 2005) para minimizar a função de máxima verossimilhança é o da busca

de multi-resolução (MR - Multiresolution Search). Este método consiste em efetuar a

varredura do campo dos sensores em uma resolução menor inicialmente em busca do

ponto de mínimo. Em seguida, efetuam-se novas buscas com maior resolução em torno do

ponto de mínimo encontrado. Embora seja uma técnica que reduz o custo computacional

de forma considerável, o método pode fazer com que a busca inicial se aproxime de um

mínimo local, levando a erros na estimação.

63

4.2 MÉTODO PROPOSTO H-ML-ENERGIA

Este trabalho propõe um novo método de localização de fontes acústicas baseado no

método ML-Energia. O principal objetivo é melhorar a localização das fontes acústicas,

pois pretende-se não mais considerar que o ruído de fundo que distorce os sensores de

energia seja descorrelatado.

Nesta proposta, será considerado que existe correlação entre sinais e ruídos, e a fre-

quência da correlação caracterizada pelo expoente de Hurst11 (0 ≤ H ≤ 1) e representada

por um processo fGn. De acordo com método ML-Energia, EQ. 4.4, e considerando que

existe correlação entre sinal e ruído, a energia recebida em cada sensor é

ui(t) = gi.K∑j=1

Bj(n− τji)|pj(n− τji)− ri|a

+ E[w2i (n)] + 2E[wi(n)Ai(n)], (4.11)

onde a correlação entre sinal e ruído é expressa por E[wi(n)Ai(n)]. Neste trabalho, propõe-

se que esta parcela que expressa a energia do ruído seja representada por um ruído fra-

cionário gaussiano (fGn), cujo parâmetroH, associado com a correlação entre sinal e ruído,

será dado pelo valor do expoente de Hurst estimado dos sinais distorcidos recebidos, e

média e variância pelas estimativas recebidas pelos diferentes sensores. Assim,

ui(t) = gi.K∑j=1

Bj(n− τji)|pj(n− τji)− ri|a

+ E[wH2i (n)], (4.12)

sendo E[wH2i (n)] a energia do fGn com média νHi

, variância ΣHie com parâmetro H

estimado do sinal recebido no sensor (xi(n)), que representa a correlação entre sinal e

ruído. Considerando que durante um quadro de localização não há muita variação na

energia do sinal, os retardos temporais podem ser desprezados, assim, pode-se reescrever

a EQ. 4.12 de forma simpli�cada,

ui(t) = gi

K∑j=1

Bj(t)

d2ij(t)+ ε(t), (4.13)

onde ε(t) representa a energia do fGn, representado por E[w2H(n)]. Como o ruído aditivo

é modelado por um fGn, o quadrado de seus valores também pode ser caracterizado por

um fGn com média representada por µHie variância σHi

.

11De�nições e conceitos acerca do expoente de Hurst e do processo fGn estão apresentadas no Capítulo

3.

64

Para obter-se a função densidade de probabilidade condicional da energia em cada

sensor ui(t), em função da posição das fontes e suas energias, são de�nidas as matrizes,

ZH =[

u1−µH1

σH1...

uL−µHL

σHL

]TGH = diag

[g1σH1

g2σH2

... gLσHL

]

D =

1d211

1d212

... 1d21K

1d221

1d222

... 1d22K

......

. . ....

1d2L1

1d2L2

... 1d2LK

B =

[B1 B2 ... BK

]TH = GHD

Λ =[ε1 ε2 ... εN

]T, (4.14)

e a EQ. (4.13) pode ser reescrita como

ZH = GHDB + Λ. (4.15)

Logo, a EQ. 4.15 pode ser expressa em termos de uma função de máxima verosimi-

lhança, dada pela EQ. 4.5, resultado em f(ZH|θ) = (2π)−N/2exp{−12(ZH −HB)T (ZH −

HB)}, cujo logaritmo é dado por

L(θ) = ||ZH −GHDB||2. (4.16)

A busca da solução da função de máxima-verosimilhança é também realizada pelo método

adotado no ML-Energia, através da busca de multi-resolução. Por considerar o expoente

de Hurst como parâmetro, o método passará a ser referenciado como H-ML-Energia.

4.3 RESULTADOS DOS EXPERIMENTOS

O objetivo desta Seção é mostrar através de testes e simulações que o método ML-

Energia apresenta degradação nos resultados de localização quando o ruído aditivo passa

a ter correlação com o sinal. Além disto, pretende-se veri�car que o método proposto, H-

ML-Energia, possibilita obter-se resultados mais próximos aos reais se comparado com o

primeiro. Neste Capítulo adota-se também a distância de Bhattacharyya para evidenciar

o quanto os erros de localização obtidos de um metro se assemelham ou se distanciam um

dos outros.

65

4.3.1 DISTÂNCIA DE BHATTACHARYYA

A distância de Bhattacharyya (BHATTACHARYYA, 1943) foi proposta em

(KAILATH, 1967) como critério para seleção de sinais baseado na distribuição de suas

amplitudes.

Considere queX1 eX2, são variáveis aleatórias com funções densidade de probabilidade

p1(x) e p2(x), respectivamente. O coe�ciente de Bhattacharyya (CB) é de�nido como,

CB =

∫ ∞−∞

√p1(x) p2(x) dx . (4.17)

a distância Bhattacharyya (dB) entre as distribuições de X1 e X2 então é dada por

dB(X1, X2) = −ln CB = −ln∫ ∞−∞

√p1(x) p2(x) dx . (4.18)

A de�nição da EQ. 4.18 obedece às propriedades de simetria, positividade, e se anula

apenas para distribuições idênticas. Ou seja,

a) dB(X1, X2) = dB(X2, X1);

b) 0 ≤ dB(X1, X2) <∞;

c) dB(X1, X2) = 0⇔ p1(x) = p2(x), para todo x.

Neste trabalho, a distância Bhattacharyya (dB) é utilizada para comparação dos resul-

tados obtidos da localização das fontes de sinais acústicos entre os métodos ML-Energia

e o proposto.

4.3.2 CENÁRIO DOS EXPERIMENTOS

Diversos experimentos foram elaborados para avaliar as técnicas de localização de

fontes baseados em energia. Os métodos foram implementados utilizando linguagem

C/C++. As fontes de sinais utilizadas foram Avião, Balbúrdia, Helicóptero, Motoserra,

Voz e Metralhadora, e os ruídos Navio, Carro, F16, Veículo Militar, Assovio e Míssil foram

empregados para simular a distorção nos sensores. Detalhes sobre os sinais e ruídos são

encontrados na TAB. 3.1. A duração dos sinais e ruídos é de 30 segundos e taxas de

amostragem de 16 kHz.

Para a localização, uma área quadrada de 50 x 50 metros foi adotada, com a origem

no centro. Quatro sensores de energia foram posicionados de forma aleatória, com ganhos

66

gi adotados, por simplicidade, como iguais a 1. Nos experimentos, apenas uma fonte

foi considerada para a localização de cada vez, de forma a melhor averiguar o efeito

da distorção acústica na localização. A posição da fonte dentro do campo de sensores

também é escolhida de forma aleatória. A localização foi realizada por diferentes quadros

do sinal, sendo que cada quadro forneceu uma posição estimada da fonte de sinal. Os

tamanhos de quadros adotados foram de N = 1024, N = 2048 e N = 4096 amostras,

sem sobreposição. A energia da fonte Sk(t) foi determinada pelos valores das amostras

dos sinais recebidos pelos sensores. Os resultados são apresentados para valores de SNR

entre 0 dB e 20 dB, com incrementos de 5 dB. Apesar de, em uma situação real, o valor

de SNR depender da distância entre fonte de sinal e sensor de energia, para as simulações

�xou-se a mesma razão sinal-ruído para todos os sensores, independente de sua posição.

As leituras de energia foram geradas de acordo com a EQ. 4.5 (ML-Energia) e a EQ. 4.13

(H-ML-Energia).

Para os experimentos com o método proposto, o valor de H empregado foi estimado do

sinal corrompido com o ruído12. O ruído branco utilizado para simulação do ML-Energia

foi gerado pelo método de Box-Muller (BOX, 1958) e o ruído fGn foi simulado pela técnica

do deslocamento de ponto médio (midpoint displacement) (BARNSLEY, 1988).

4.3.3 RESULTADOS DO ML-ENERGIA COM RUÍDOS REAIS

Em uma primeira situação, foram avaliadas distintas localizações com o método ML-

Energia utilizando o ruído branco gaussiano, conforme na proposta original e, também,

com os ruídos reais escolhidos. Embora o método ML-Energia forneça a posição estimada

da fonte a ser localizada, neste trabalho o critério de comparação empregado é o de erro

de estimação (Ek) da posição, de�nido como a distância (em metros) entre a posição real

da fonte e a estimada, ou seja,

Ek =√|rk − rk|2, (4.19)

onde rk simboliza a posição estimada obtida em cada quadro do sinal. Ao �nal de cada

localização, os erros de estimação foram agrupados e ilustrados sob a forma de histogramas

normalizados, com uma faixa de 0 a 80 metros e 25 divisões de 3,2 metros cada. Os

valores das médias e desvio padrão dos resultados estão também apresentados junto aos

histogramas.

12O método baseado em wavelets foi utilizado. Os �ltros e coe�cientes são apresentados no Capítulo 3,

TAB. 3.2.

67

(a) Avião + Branco (b) Avião + Carro (c) Avião + F16 (d) Avião + Míssil

(e) Balbúrdia +Branco

(f) Balbúdia +Carro

(g) Balbúrdia + F16 (h) Balbúrdia +Míssil

(i) Helicóptero +Branco

(j) Helicóptero +Carro

(k) Helicóptero +F16

(l) Helicóptero +Míssil

FIG. 4.1: Resultado da localização utilizando ML-Energia com ruídos reais. Os histogramas mostramo erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinado ruído,mencionado na legenda, a um valor de SNR de 5 dB.

A FIG. 4.1 apresenta 3 linhas e 4 colunas de histogramas, sendo que as linhas represen-

tam, de cima para baixo, as fontes Avião, Balbúrdia e Helicóptero, respectivamente, e as

colunas indicam, o ruído de fundo utilizado, respectivamente da esquerda para a direita,

Branco, Carro, F16 e Míssil. A razão sinal-ruído empregada para neste caso é a de 5 dB.

De acordo com os resultados obtidos no Capítulo 3, Carro é considerado um ruído esta-

cionário, F16 é não-estacionário e Míssil foi classi�cado como altamente não-estacionário

(Vide FIG. 3.7).

Percebe-se que o resultado do ML-Energia com ruído branco difere muito dos cor-

respondentes quando considera-se ruído real. Isto pode ser observado, por exemplo, nos

histogramas da fonte Avião, onde de uma média de erro igual a 3,81 metros na localização

com o ruído Branco, atinge um aumento para 17,14 metros quando o ruído de fundo é

o Míssil. Resultado semelhante pode ser notado para a fonte Balbúrdia, que apresentou

média de erro 4,32 metros com distorção pelo ruído Branco contra 25,25 metros quando

o Míssil é o ruído de fundo. Mesmo quando o ruído aditivo é o Carro, ruído estacionário,

68

(a) Motoserra +Branco

(b) Motoserra +Carro

(c) Motoserra + F16 (d) Motoserra +Míssil

(e) Voz + Branco (f) Voz + Carro (g) Voz + F16 (h) Voz + Míssil

(i) Metralhadora +Branco

(j) Metralhadora +Carro

(k) Metralhadora +F16

(l) Metralhadora +Míssil

FIG. 4.2: Resultado da localização utilizando ML-Energia com ruídos reais. Os histogramas mostramo erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinado ruído,mencionado na legenda, a um valor de SNR de 10 dB.

a fonte Helicóptero apresentou uma diferença razoável nos resultados quando comparado

ao caso do ruído Branco. Percebe-se que para as três fontes, as maiores diferenças entre

o caso com ruído Branco se deram quando o ruído aditivo é o Míssil. Isto pode ser ex-

plicado pelo fato deste ruído ser o mais não-estacionário dentre os demais. Além disto,

a não-estacionaridade das fontes também in�uencia nos resultados. Conforme pode se

perceber que, para um mesmo ruído de fundo, a fonte mais não-estacionária apresenta

maiores erros de localização, por exemplo, para o ruído F16, a média do erro de localiza-

ção obtida com a fonte Avião é de 16,90 metros com desvio de 11,95m. Balbúrdia, sendo

mais não-estacionária, apresentou um maior erro (17,16 metros) e um maior desvio (13,13

metros). Já com a fonte Helicóptero, mais não-estacionária entre as três, erro e desvio

aumentaram para 18,05 metros e 13,81 metros, respectivamente.


tam, de cima para baixo, as fontes Motoserra, Voz e Metralhadora, respectivamente, e as

colunas indicam, o ruído de fundo utilizado, respectivamente da esquerda para a direita,

69

Branco, Carro, F16 e Míssil. A razão sinal-ruído empregada para neste caso é a de 10 dB.

Embora para este segundo caso, a razão sinal-ruído tenha aumentado, a diferença entre os

resultados do ML-Energia com ruído Branco e com ruídos reais continua perceptível. A

fonte Motoserra apresentou uma média de erro de estimação igual a 3,37 metros, desvio

2,58 metros quando o ruído de fundo é o Branco, porém, empregando-se o F16 como

ruído, a média de erro aumenta para 10,44 metros, desvio 10,80 metros. A fonte Voz é

localizada com média de erro de 6,49 metros quando a distorção é descorrelatada, mas

dobra este valor quando o ruído aditivo é gerado pelo Carro. Com o Míssil, a média de

erro é quase triplicada. A fonte Metralhadora apresentou uma média de 10,02 metros

com o ruído Branco, aumentado para quase 15 metros quando o ruído F16 foi utilizado.

Mesmo um ruído estacionário, como é o caso do Carro, resultou em grande diferença se

comparada a localização da Metralhadora com o ruído Branco (aumento de 4 metros na

média de erro e quase 1 metro no desvio padrão).

4.3.4 RESULTADOS DE LOCALIZAÇÃO DO MÉTODO PROPOSTO H-ML-

ENERGIA

Para a avaliação do método proposto, a localização de fonte foi realizada com as

mesmas fontes e ruídos reais utilizadas para os experimentos com o ML-Energia. O erro

de estimação foi computado e obtidos diversos histogramas correspondentes.


tam, de cima para baixo, as fontes Avião, Helicóptero e Metralhadora, respectivamente,

e as colunas indicam qual método foi empregado, respectivamente da esquerda para a

direita, ML-Energia com ruído Branco, ML-Energia com ruídos reais e H-ML-Energia.

A razão sinal-ruído empregada para neste caso é a de 5 dB. A fonte Avião corrompida

com o ruído Branco apresentou média de erros de 3,81 metros e desvio de 2,10, sendo que

quando corrompida por um ruído real, Carro, a média e o desvio do erro é de 17,21 metros

e 10,58, respectivamente. Para este caso, o método H-ML-Energia obteve uma média de

erro de 12,41 metros e um desvio de 10,95. Note que o desvio obtido pelo H-ML-Energia

é muito próximo do obtido quando o ruído de fundo era um ruído real, com uma diferença

menor que 0,50 metro. A diferença entre o valor da média obtida também é pequena,

igual a 4,80 metros, sendo que para o ML-Energia esta diferença chega aos 13,40 me-

tros. A fonte Helicóptero obteve uma média de erro de 22,50 metros considerando o ruído

Veículo Militar real, diferindo muito da apresentada pelo ML-Energia, 13,03 metros. Para

70

esta situação, em que a fonte de sinal e o ruído são não-estacionários, o H-ML-Energia

obteve uma média 15,35 metros, logo, mais próxima do valor real que a do ML-Energia.

O terceiro caso, onde tanto a fonte, Metralhadora, quanto o ruído, Míssil, são os mais

não-estacionários dentre os sinais e ruídos selecionados, o método H-ML-Energia obteve

um resultado muito próximo ao do real, com uma diferença de apenas 1,04 metros na mé-

dia e 1,06 metros para o desvio padrão, um resultado muito superior se comparado com

o ML-Energia que para este caso obteve uma diferença de 14,75 metros e 11,50 metros,

respectivamente.

Mais uma vez, os resultados mostram que o método proposto se aproxima mais da

localização obtida quando a distorção é causada por ruídos reais do que o método ML-

Energia, que considera ruído descorrelatado com o sinal.

4.3.4.1 COMPARAÇÃO DOS MÉTODOS DE LOCALIZAÇÃO

De forma a avaliar o desempenho de localização dos métodos de energia, foi empregada

a distância de Bhattacharyya, pois pode-se realizar diversas comparações entre as fontes

com todos os ruídos e para todos os valores de SNR utilizados. Deste modo, o valor

da distância foi calculado entre os histogramas de erro do método ML-Energia e dos

ruídos reais. Da mesma forma, determinou-se as distâncias entre os resultados reais e

os gerados pelo método proposto. Todas as distâncias estão apresentadas na TAB. 4.1,

que mostra para cada fonte, a distância obtida entre os histogramas gerados pelo método

ML-Energia e o H-ML-Energia, para todos os ruídos empregados e para cada valor de

SNR. Comparando-se os métodos, um menor valor de distância indica que o método mais

se aproximou do resultado gerado pelos ruídos reais. Para facilitar a visualização, os casos

em que foram encontradas as maiores diferenças entre o H-ML-Energia e o ML-Energia

estão em negrito.

De acordo com os valores apresentados na TAB. 4.1, percebe-se que o método H-

ML obteve menores distâncias com os resultados reais, se comparado com o ML-Energia.

Para a fonte Balbúrdia, corrompida com Assovio, sob SNR de 5 dB, as distâncias obtidas

para o ML-Energia e H-ML foram 0,51 e 0,16 respectivamente, uma diferença de quase

3 vezes, ou seja, o método proposto gerou resultados 3 vezes mais semelhantes aos reais,

se comparados com o ML-Energia. Já quando a SNR é elevada para 15 dB, a diferença

aumenta para quase 4 vezes (0,26 e 0,07). A fonte Avião quando corrompida com ruído

Carro, sob SNR de 5 dB mostra valores de distância de 0,71 e 0,18 para os métodos ML-

71

(a) Avião + Branco (b) Avião + Carro (c) Avião + Carro (H-ML)

(d) Helicóptero + Branco (e) Helicóptero + V. Militar (f) Helicóptero + V. Militar(H-ML)

(g) Metralhadora + Branco (h) Metralhadora + Míssil (i) Metralhadora + Míssil(H-ML)

FIG. 4.3: Resultado da localização utilizando ML-Energia com ruídos reais e H-ML-Energia. Os histogra-mas mostram o erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinadoruído, mencionado na legenda, a um valor de SNR = 5 dB.

Energia e H-ML-Energia, respectivamente, uma diferença de quase 4 vezes favorável ao

método proposto.

A comparação entre os resultados obtidos pelos métodos ML-Energia e H-ML-Energia

para os tamanhos de quadros de 2048 e 4096 amostras é ilustrada sob a forma de grá�cos

para quatro fontes de sinais, Avião, Balbúrdia, Voz e Motoserra, corrompidas com três

ruídos, sendo selecionados o Carro, ruído estacionário, Balbúrdia, por ser não-estacionário

e Míssil, classi�cado como altamente não-estacionário. Os grá�cos são apresentados nas

FIGS. 4.4 e 4.5, sendo que a primeira mostra o resultado para quadros de 2048 e a segunda,

4096 amostras.

De acordo com a FIG. 4.4, o método H-ML-Energia obteve uma maior diferença se

72

TAB. 4.1: Resultados da distância de Bhattacharyya calculada entre os histogramas de erro obtidos peloML-Energia e pelo H-ML-Energia, quando comparados com os histogramas de erro de localização comruídos reais. O tamanho do quadro considerado para este caso é o de 1024 amostras.

Fonte SNRV. Militar Míssil Carro Assovio Navio Caça

ML H-ML ML H-ML ML H-ML ML H-ML ML H-ML ML H-ML

Balbúrdia

0dB 0,22 0,18 0,44 0,42 0,22 0,09 0,18 0,14 0,46 0,31 0,40 0,07

5dB 0,40 0,21 0,77 0,75 0,44 0,18 0,51 0,16 0,72 0,48 0,36 0,3010dB 0,44 0,29 0,64 0,59 0,31 0,23 0,54 0,23 0,81 0,54 0,74 0,5715dB 0,07 0,06 0,29 0,17 0,14 0,08 0,26 0,07 0,13 0,08 0,11 0,0920dB 0,07 0,07 0,11 0,09 0,12 0,08 0,15 0,14 0,05 0,04 0,09 0,06

Avião

0dB 0,31 0,11 0,55 0,51 0,30 0,05 0,24 0,19 0,24 0,14 0,50 0,09

5dB 0,61 0,33 1,55 1,03 0,71 0,18 0,76 0,53 0,36 0,23 0,61 0,2010dB 0,25 0,19 0,92 0,86 0,30 0,20 0,67 0,52 0,20 0,14 0,65 0,43

15dB 0,12 0,08 0,23 0,22 0,12 0,09 0,39 0,26 0,05 0,04 0,08 0,0620dB 0,33 0,26 0,25 0,19 0,33 0,22 0,38 0,26 0,26 0,17 0,32 0,21

Helicóptero

0dB 0,04 0,04 0,33 0,25 0,04 0,03 0,06 0,05 0,08 0,06 0,11 0,085dB 0,04 0,03 0,38 0,25 0,04 0,03 0,05 0,05 0,05 0,04 0,10 0,0710dB 0,04 0,03 0,23 0,18 0,04 0,02 0,05 0,04 0,04 0,02 0,10 0,0715dB 0,04 0,03 0,13 0,12 0,04 0,02 0,07 0,05 0,03 0,02 0,12 0,08

20dB 0,07 0,04 0,11 0,11 0,06 0,03 0,06 0,05 0,04 0,04 0,08 0,05

Motoserra

0dB 0,16 0,12 0,57 0,38 0,16 0,05 0,14 0,14 0,12 0,08 0,29 0,135dB 0,24 0,22 0,58 0,55 0,29 0,12 0,34 0,28 0,14 0,11 0,26 0,2110dB 0,20 0,18 0,50 0,46 0,25 0,17 0,38 0,36 0,10 0,08 0,19 0,1515dB 0,08 0,08 0,29 0,29 0,14 0,14 0,25 0,25 0,04 0,04 0,08 0,0820dB 0,06 0,05 0,10 0,10 0,11 0,11 0,17 0,16 0,05 0,04 0,07 0,07

Voz

0dB 0,07 0,07 0,47 0,31 0,09 0,03 0,08 0,07 0,09 0,07 0,16 0,085dB 0,09 0,07 0,39 0,30 0,13 0,06 0,15 0,14 0,07 0,06 0,15 0,1010dB 0,08 0,07 0,36 0,24 0,10 0,08 0,14 0,14 0,05 0,04 0,10 0,0815dB 0,09 0,06 0,20 0,15 0,07 0,06 0,15 0,12 0,05 0,04 0,07 0,0620dB 0,08 0,07 0,16 0,11 0,07 0,06 0,13 0,10 0,06 0,04 0,08 0,05

Metralhadora

0dB 0,32 0,25 0,47 0,32 0,15 0,12 0,27 0,18 0,58 0,39 0,14 0,095dB 0,49 0,33 0,34 0,26 0,31 0,21 0,29 0,22 0,52 0,40 0,39 0,2610dB 0,35 0,23 0,28 0,19 0,29 0,22 0,34 0,23 0,37 0,29 0,34 0,2315dB 0,18 0,14 0,14 0,11 0,21 0,14 0,22 0,17 0,20 0,13 0,17 0,1220dB 0,19 0,13 0,19 0,13 0,24 0,16 0,24 0,16 0,17 0,11 0,15 0,10

comparado com o ML-Energia para todas as combinações e ruídos apresentadas. A dis-

tância calculada para a fonte Avião corrompida com Carro, foi de 0,57 para o ML-Energia

contra 0,02 obtida pelo método H-ML-Energia, para o valor de SNR de 0 dB. As maiores

diferenças podem ser observadas para a fonte Balbúrdia corrompida por Míssil, onde

o ML-Energia apresentou uma distância de Battacharyya próxima de 1,98, enquanto o

método proposto atingiu um valor de 0,5. Para o caso da fonte Voz corrompida com

Balbúrdia, o H-ML apresentou diferença de 0,20 na distância com relação ao ML-Energia

para os valores de 0 dB e 5 dB. Frente aos resultados, percebe-se que os resultados são

favoráveis ao método proposto, mesmo sendo as fontes e ruídos não-estacionários.

Da análise da FIG. 4.5, onde a distância de Bhattacharyya é mostrada para a localiza-

ção com quadros maiores (4096 amostras), percebe-se um aumento do valor da distância

para a fonte Avião, corrompida pelo ruído Carro, principalmente entre 0 dB e 5 dB. A

fonte Voz corrompida pela Balbúrdia apresentou uma diferença de distância próxima de

73

(a) Avião + Carro (b) Avião + Balbúrdia (c) Avião + Míssil

(d) Balbúrdia + Carro (e) Balbúrdia + Balbúrdia (f) Balbúrdia + Míssil

(g) Voz + Carro (h) Voz + Balbúrdia (i) Voz + Míssil

(j) Motoserra + Carro (k) Motoserra + Balbúrdia (l) Motoserra + Míssil

FIG. 4.4: Distância de Bhattacharrya entre ML-Energia e ruídos reais (em vermelho) e H-ML-Energia eruídos (linhas azuis), para os valores de SNR entre 0 dB e 20 dB e quadros de 2048 amostras.

0,30 para 0 dB e 5 dB. Uma diferença elevada também pode ser vista para a fonte Mo-

toserra corrompida com Balbúrdia, mesmo sendo tanto fonte quanto ruído de elevada

não-estacionaridade. Se a comparação for feita entre ambos os grá�cos, pelo número de

amostras, percebe-se que ocorreu um aumento na diferença entre as distâncias do ML-

Energia e H-ML-Energia. Isto pode ser percebido de forma mais notável para os casos

da fonte Motoserra com ruído Míssil e para Motoserra adicionada com Balbúrdia. Esta

maior diferença é re�exo de um maior número de amostras utilizados no quadro, o que faz

com que o valor do expoente de Hurst possa ser mais precisamente estimado, permitindo

que se gere um fGn que represente melhor o ruído real.

Por �m, uma outra medida de comparação dos resultados obtidos pelos métodos é

através de uma medida denominada erro médio quadrático (RMSE - Root Mean Squared

Error), aqui de�nido como

RMSE =1

N

N∑i

√(rki − rki)

2, (4.20)

onde rki é a posição estimada da fonte k durante o quadro i, e rki a sua real posição no

intervalo de tempo. Sendo assim, o valor de RMSE foi calculado para todas as localizações

realizadas neste trabalho, e alguns resultados são mostrados na FIG. 4.6.

Como pode ser notado, em todas as situações apresentadas, o método proposto se

74

(a) Avião + Carro (b) Avião + Balbúrdia (c) Avião + Míssil

(d) Balbúrdia + Carro (e) Balbúrdia + Balbúrdia (f) Balbúrdia + Míssil

(g) Voz + Carro (h) Voz + Balbúrdia (i) Voz + Míssil

(j) Motoserra + Carro (k) Motoserra + Balbúrdia (l) Motoserra + Míssil

FIG. 4.5: Distância de Bhattacharrya entre ML-Energia e ruídos reais(em vermelho) e H-ML-Energia eruídos (linhas azuis), para os valores de SNR entre 0 dB e 20 dB e quadros de 4096 amostras.

aproxima mais dos resultados obtidos quando a distorção é causada por ruídos reais e

correlatados. Nota-se que para a fonte Avião corrompida por ruído Carro, houve grande

distância entre o valor de RMSE do método proposto se comparado com o ML-Energia,

particularmente para os valores de SNR 0 dB e 5 dB. Quando o ruído empregado é o

Veículo Militar, ainda percebe-se uma diferença signi�cativa de RMSE para os valores de

SNR 0 dB e 5 dB. O maior afastasmento entre as curvas do H-ML-Energia e ML-Energia

pode estar relacionado com o fato do ruído ser não-estacionário. Para a distorção causada

pelo Assovio, mais não-estacionário dentre os três apresentados, é notável a queda dos

valores de RMSE para o método proposto, porém, ainda permanecendo mais próximo dos

valores representados pela curva dos ruídos reais do que o método ML-Energia.

Para a fonte Voz, sob distorção gerada pelo ruído Carro, observa-se que o método

H-ML-Energia apresenta um bom resultado entre 0 dB e 10 dB, com valores de RMSE

mais próximos dos obtidos pelos ruídos reais. Analisando o caso em que o ruído é o

Veículo Militar, de maior INS, há uma leve degradação do método, porém o mesmo ainda

permanece mais próximo ao resultado real. Quando a Voz é localizada com o ruído Míssil,

os resultados do método proposto são melhores para os valores de 0 dB e 15 dB.

Da comparação entre os resultados obtidos pelas duas fontes e sabendo que a fonte

Voz é mais não-estacionária que o Avião, pode-se perceber que para os três ruídos, os

75

(a) Avião + Carro (b) Avião + Veículo Militar (c) Avião + Assovio

(d) Voz + Carro (e) Voz + Veículo Militar (f) Voz + Assovio

FIG. 4.6: Comparação entre os métodos ML-Energia, H-ML-Energia e a localização com ruídos reaispara as fontes Avião e Voz. A linha em verde mostra o RMSE obtido quando as fontes são distorcidas porruídos reais. Em vermelho é indicado o RMSE obtido na localização usando o ML-Energia, que consideraruído aditivo sem correlação. O método H-ML-Energia tem seus valores de RMSE representados pelalinha azul.

valores de RMSE são mais elevados se comparados com a localização da fonte Avião,

ou seja, a localização da fonte Voz apresenta mais erros do que a da fonte Avião. Esta

observação indica novamente que o desempenho da localização das fontes acústicas pode

ser relacionado com o INS das mesmas, de forma que quanto mais não-estacionário é um

sinal, maiores são os erros de localização.

4.4 RESUMO

Este Capítulo apresentou o método de localização de fontes baseado na energia do

sinal recebida por sensores. Foi mostrada a técnica ML-Energia, que utiliza-se da má-

xima verosimilhança para estimar a posição de fontes acústicas baseadas nas medições

de energia de uma rede de sensores ad-hoc. Este método considera em sua formulação

que o ruído aditivo que distorce o sistema é descorrelatado, diferindo de ruídos reais, que

possuem correlação. Foi proposto então um método baseado no ML-Energia que leva

em consideração em seu modelo, a correlação entre ruído e fonte de sinal, e que utiliza

o expoente de Hurst para modelar a correlação. Diversas simulações foram realizadas,

onde mostrou-se que o método ML-Energia difere muito em seus resultados quando com-

parado a localização obtida por ruídos reais. Ao �nal do Capítulo, foram apresentados

resultados comparativos entre os métodos H-ML-Energia e o ML-Energia, e através deles,

constatado que o modelo proposto proporciona uma localização de fonte mais próxima da

real, quando os ruídos são correlatados, se comparado com o ML-Energia.

76

5 CONCLUSÃO

Esta Dissertação apresentou duas propostas de métodos de localização de fontes acús-

ticas, com o objetivo de contornar a grande limitação existente nos métodos considerados

como estado da arte, que é a consideração de que o ruído que distorce o sistema é descor-

relatado do sinal da fonte (gaussiano branco). Empregando a técnica de localização de

fontes pela estimação de retardos temporais (TDE), o método SRP-H-PHAT foi proposto,

sendo em sua formulação, a correlação existente entre sinal e ruído modelado por um pro-

cesso fracionário gaussiano com um parâmetro de Hurst apropriado, estimado dos sinais

corrompidos recebidos pelos sensores. Analogia semelhante foi utilizada na proposta do

método H-ML-Energia, que foi proposto segundo o princípio de localização de fontes por

meio da energia acústica.

Para a avaliação dos dois métodos propostos, foram selecionados sinais e ruídos acús-

ticos reais com diferentes índices de não-estacionaridade, além de distintas estruturas de

correlação. Os sinais foram corrompidos por ruídos reais para diversos valores de razão

sinal-ruídos e utilizados para a localização. Em um primeiro momento o método SRP-

PHAT, estado da arte dos métodos baseados em TDE, foi empregado na localização de

fontes corrompidas por ruídos reais. Os resultados obtidos foram comparados com os de

uma localização onde a distorção é causada por um ruído branco. Da análise obtida,

mostrou-se que o SRP-PHAT apresenta degradação de seus resultados de localização

quando a distorção é causada por ruídos reais. Após isto, o método proposto foi empre-

gado na localização das fontes quando corrompidas por ruídos acústicos reais. Através

da comparação das taxas de acerto obtidas, mostrou-se que o método proposto apresenta

resultados mais próximos ao da localização envolvendo ruídos reais do que o SRP-PHAT,

mesmo quando os sinais e ruídos possuem elevado valor de INS.

Estratégia semelhante foi utilizada para a avaliação da proposta H-ML-Energia, onde

de início mostrou-se que os resultados do estado da arte, ML-Energia, sofrem grande

degradação quando as fontes são localizadas na presença de distorções causadas por ruídos

reais. Através do uso da distância de Bhattacharrya, mostrou-se que os resultados obtidos

pelo método proposto se aproximam mais dos reais do que o ML-Energia. Dos resultados

obtidos, veri�cou-se que o H-ML-Energia obteve resultados ainda melhores quando o

77

tamanho de quadro da localização foi aumentado.

As principais contribuições apresentadas nesta dissertação podem ser resumidas da

seguinte forma:

• Proposta de método de localização baseado em TDE que considera que a distorção

é causada por ruídos correlacionados com o sinal da fonte. A proposta utiliza o

expoente de Hurst, através de um processo fGn, para modelar a correlação. Em

comparação com o estado da arte, o método proposto apresentou resultados de

localização mais próximos se comparados com os obtidos com o emprego de ruídos

reais.

• Análise do desempenho do método de localização SRP-PHAT quando a distorção

do sistema é causada por ruídos acústicos reais. Comparando-se os resultados de

localização obtidas pelo método quando as fontes sofrem distorções causadas por

ruídos reais com os obtidos quando a distorção do sistema é representada por um

ruído branco, mostrou-se que existe grande divergência entre os resultados.

• Proposta de método de localização baseado em energia acústica que considera que

a distorção do sistema é causada por ruídos correlacionados com o sinal da fonte.

A proposta utiliza o expoente de Hurst, através de um processo fGn, para modelar

a correlação. Em comparação com o estado da arte, o método proposto apresen-

tou resultados de localização mais próximos se comparados com os obtidos com o

emprego de ruídos reais.

• Análise do desempenho do método de localização ML-Energia quando a distorção

deixa de ser descorrelatada. Os resultados apresentados mostram que há grande

degradação nos resultados de localização quando a distorção do sinal passa a ser

causada por um ruído real. A diferença é ainda mais evidente quando os ruídos são

altamente não-estacionários.

• Constatação de que sinais com maior índice de não-estacionariedade apresentam

mais erros na sua localização do que os de menor INS.

• Constatação de que sinais com valores de INS elevados apresentam uma maior va-

riância de seu parâmetro H, quando o mesmo é analisado por quadros de curta

duração.

78

5.1 SUGESTÕES PARA TRABALHOS FUTUROS

Nesta Seção são destacadas algumas sugestões para trabalhos futuros.

• Investigar as técnicas de realce de voz baseada na decomposição empírica de modos

(EMD - Empirical Mode Decomposition) (HUANG, 1998), com �nalidade de reduzir

a in�uência dos ruídos reais nos resultados de localização de fonte.

• Investigar uma melhoria dos métodos de localização através da inserção do valor do

INS, de tal modo que a localização de fontes de sinais altamente não-estacionários

possam apresentar melhores resultados na localização da fonte.

• Investigar a integração dos métodos de localização de fontes com as técnicas de

auto-posicionamento dos sensores (MAHAJAN, 1999), veri�cando sua viabilidade e

analisando o seu desempenho

5.2 COMENTÁRIOS FINAIS

Esta Dissertação apresentou duas propostas de métodos de localização de fontes acús-

ticas, com o objetivo de contornar a grande limitação existente na literatura, que é a

consideração de que o ruído que distorce o sistema é descorrelatado do sinal da fonte.

Ambos os métodos propostos apresentaram resultados mais próximos aos reais se com-

parados com os respectivos estado da arte, mesmo quando os sinais e ruídos possuem

distintos valores de INS.

79

6 REFERÊNCIAS BIBLIOGRÁFICAS

BARNSLEY, M., DEVANEY, R., MANDELBROT, B., PEITGEN, H., SAUPE, D. eVOSS, R. The Science of Fractal Images. Springer-Verlag, USA, 1988.

BASSEVILLE, M. Distance measures for signal processing and pattern recognition. Sig-nal Processing, 18(4):349�369, 1989.

BHATTACHARYYA, A. On a measure of divergence between two statistical popula-tions de�ned by probability distributions. Bulletin of the Calcutta MathematicalSociety, 35:99�109, 1943.

BORGNAT, P., FLANDRIN, P., HONEINE, P., RICHARD, C. e XIAO, J. Testingstationarity with surrogates: A time-frequency approach. IEEE Transactions onSignal Processing, 58(7):3459�3470, 2010.

BOX, G. e MULLER, M. A note on the generation of random normal deviates. TheAnnals of Mathematical Statistics, 29(2):610�611, 1958.

BRANDSTEIN, M., ADCOCK, J. e SILVERMAN, H. A closed-form location estimatorfor use with room environment microphone arrays. IEEE Transactions on Speech,and Audio Processing, 5(1):45�50, 1997.

CARTER, G. Variance bounds for passively locating an acoustic source with a symmetricline array. The Journal of the Acoustical Society of America, 62(4):922�926,1977.

CARTER, G. Time delay estimation for passive sonar signal processing. IEEE Trans-actions on Acoustics, Speech and Signal Processing, 29(3):463�470, 1981.

CARTER, G., NUTTALL, A. e CABLE, P. The smoothed coherence transform. Pro-ceedings of the IEEE, 61(10):1497�1498, 1973.

CHAN, Y. e HO, K. A simple and e�cient estimator for hyperbolic location. IEEETransactions on Signal Processing, 42(8):1905�1915, 1994.

CHUNG, P. e BOEHME, J. The methodology of the maximum likelihood approach -estimation, detection, and exploration of seismic events. IEEE Signal ProcessingMagazine, 29(3):40�46, 2012.

DAUBECHIES, I. Ten Lectures on Wavelets. SIAM, Philadelphia, 1992.

DIBIASE, J., SILVERMAN, H. e BRANDSTEIN, M. Robust localization in reverberantrooms. Em Microphone Arrays: Signal Processing Techniques and Applica-tions, págs. 155�180. Springer, 2001.

80

DO, H., SILVERMAN, H. e YU, Y. A real-time SRP-PHAT source location implementa-tion using stochastic region contraction (SRC) on a large-aperture microphone array.Proceedings of the IEEE International Conference on Acoustics, Speech,and Signal Processing (ICASSP'07), Honolulu, 2007.

DONOHUE, K., HANNEMANN, J. e DIETZ, H. Performance of phase transform fordetecting sound sources with microphone arrays in reverberant and noisy environments.Signal Processing, 87(7):1677�1691, 2007.

DRANKA, E. e COELHO, R. Métodos PHAT, FLOS-PHAT e ML-energia para localiza-ção de fontes de sinais acústicos impulsivos. Anais do XXXI Simpósio Brasileirode Telecomunicações (SBrT'13), Fortaleza, 2013.

ECKART, C. Optimal recti�er systems for the detection of steady signals. ScrippsInstitution of Oceanography, SIO Ref 52-11, 1952.

FANG, B. Simple solutions for hyperbolic and related position �xes. IEEE Transactionson Aerospace and Electronic Systems, 26(5):748�753, 1990.

GAROFOLO, J., LAMEL, L., FISHER, W., FISCUS, J., PALLETT, D., DAHLGREN,N. e ZUE, V. TIMIT acoustic-phonetic continuous speech corpus. Linguistic DataConsortium, 1993.

GEORGIOU, P., TSAKALIDES, P. e KYRIAKAKIS, C. Alpha-stable modeling of noiseand robust time-delay estimation in the presence of impulsive noise. IEEE Transac-tions on Multimedia, 1(3):291�301, 1999.

HAHN, W. e TRETTER, S. Optimum processing for delay-vector estimation in passivesignal arrays. IEEE Transactions on Information Theory, 19(5):608�614, 1973.

HUANG, N., SHEN, Z., LONG, S., WU, M., SHIH, H., ZHENG, Q., YEN, N., TUNG, C.e LIU, H. The empirical mode decomposition and the hilbert spectrum for nonlinear andnon-stationary time series analysis. Proceedings of the Royal Society of London.Series A: Mathematical, Physical and Engineering Sciences, 454(1971):903�995, 1998.

HURST, H. Long term storage capacity of reservoirs. Transaction of the Americansociety of civil engineer, 116, 1951.

KAILATH, T. The divergence and Bhattacharyya distance measures in signal selection.IEEE Transactions on Communication Technology, 15(1):52�60, 1967.

KINSLER, L. Fundamentals of Acoustics. Wiley, New York, 1982.

KNAPP, C. e CARTER, G. The generalized correlation method for estimation of timedelay. IEEE Transactions on Acoustics, Speech and Signal Processing, 24(4):320�327, 1976.

LI, D. e HU, Y. Energy based collaborative source localization using acoustic micro-sensorarray. EURASIP Applied Signal Processing, 4:321�337, 2003.

81

LI, D., WONG, K., HU, Y. e SAYEED, A. Detection, classi�cation and tracking oftargets in distributed sensor networks. IEEE Signal Processing Magazine, 19(2):17�29, 2002.

LI, D. e HU, Y. Least square solutions of energy based acoustic source localization prob-lems. Proceedings of the International Conference on Parallel Processing(ICPP'04), 2004.

LI, Y., WHITE, M. e FRANKE, S. New fast �eld programs for anisotropic sound prop-agation through an atmosphere with a wind velocity pro�le. The Journal of theAcoustical Society of America, 95(2):718�726, 1994.

MAHAJAN, A. e FIGUEROA, F. An automatic self-installation and calibration methodfor a 3d position sensing system using ultrasonics. Robotics and AutonomousSystems, 28(4):281�294, 1999.

MANDELBROT, B. e NESS, J. Fractional brownian motions, fractional noises and ap-plications. SIAM Review, 10(4), 1968.

MING, J., HAZEN, T., GLASS, J. e REYNOLDS, D. Robust speaker recognition in noisyconditions. IEEE Transactions on Audio, Speech, and Language Processing,15(5):1711�1723, 2007.

MORAGUES, J., VERGARA, L., GOSALBEZ, J., MACHMER, T., SWERDLOW, A. eKROSCHEL, K. Background noise suppression for acoustic localization by means ofan adaptive energy detection approach. Proceedings of the IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP'08), págs.2421�2424, Nevada, 2008.

NIKIAS, C. e SHAO, M. Signal Processing with Alpha-Stable Distributions andApplications. Wiley, New York, 1995.

OMOLOGO, M. e SVAIZER, P. Use of the cross-power-spectrum phase in acoustic eventlocation. IEEE Transactions on Speech and Audio Processing, 5(3):288�292,1997.

PAPOULIS, A. e PILLAI, S. Probability, random variables, and stochastic pro-cesses. McGraw-Hill, 2002.

PATWARI, N., ASH, J., KYPEROUNTAS, S., HERO, A., MOSES, R. e CORREAL, N.Locating the nodes: cooperative localization in wireless sensor networks. IEEE SignalProcessing Magazine, 22(4):54�69, 2005.

PETERSON, J. e KYRIAKAKIS, C. Hybrid algorithm for robust, real-time source lo-calization in reverberant environments. Proceedings of the IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP'05), 4:1053�1056, Philadelphia, 2005.

82

POURMOHAMMAD, A. e AHADI, S. N -dimensional N -microphone sound source lo-calization. EURASIP Journal on Audio, Speech, and Music Processing, 2013(27), 2013.

ROGERS, K. e FINN, A. Three-dimensional uav-based atmospheric tomography. Journalof Atmospheric and Oceanic Technology, 30:336�344, 2012.

ROTH, P. E�ective measurements using digital signal analysis. IEEE Spectrum, 8(4):62�70, 1971.

SAMORODNITSKY, G. e TAQQU, M. Stable Non-Gaussian Random Processes:Stochastic Models and In�nite Variance. Chapman & Hall, London, 1994.

SHENG, X. e HU, Y. Maximum likelihood multiple-source localization using acousticenergy measurements with wireless sensor networks. IEEE Transactions on SignalProcessing, 53(1):44�53, 2005.

VALIN, J., MICHAUD, F., ROUAT, J. e LETOURNEAU, D. Robust sound source local-ization using a microphone array on a mobile robot. Proceedings of the IEEE/RSJInternational Conference on Intelligent Robots and Systems (IROS'03), 2:1228�1233, 2003.

VARGA, A. e STEENEKEN, H. Assessment for automatic speech recognition ii: NOISEX-92: a database and an experiment to study the e�ect of additive noise on speechrecognition systems. Speech Communications, 12(3):247�251, 1993.

VEITCH, D. e ABRY, P. Wavelet analysis of long-range-dependent tra�c. IEEE Trans-actions on Information Theory, 44(1):2�15, 1998.

VELASCO, J., PIZARRO, D. e GUARASA, M. Source localization with acoustic sensorarrays using generative model based �tting with sparse constraints. Sensors, 12(10):13781�13812, 2012.

WANG, H. e CHU, P. Voice source localization for automatic camera pointing systemin videoconferencing. Proceedings of the IEEE International Conference onAcoustics, Speech, and Signal Processing (ICASSP'97), 1(1):187�190, Munich,1997.

WEBSTER, R. Ambient noise statistics. IEEE Transactions on Signal Processing,41(6):2249�2253, 1993.

ZÃO, L. e COELHO, R. Generation of coloured acoustic noise samples with non-gaussiandistribution. IET Signal Processing, 6(7):684�688, 2012.

83

localizaÇÃo de fontes de sinais em presenÇa de … · dissertação de mestrado apresentada ao...

Documents