localizaÇÃo de fontes de sinais em presenÇa de … · dissertação de mestrado apresentada ao...
TRANSCRIPT
INSTITUTO MILITAR DE ENGENHARIA
ELOI DRANKA JUNIOR
LOCALIZAÇÃO DE FONTES DE SINAIS EM PRESENÇA DEDISTORÇÕES ACÚSTICAS NÃO-ESTACIONÁRIAS COM
USO DE SENSORES FRACIONÁRIOS
Dissertação de Mestrado apresentada ao Curso deMestrado em Engenharia Elétrica do Instituto Militar deEngenharia, como requisito parcial para obtenção do títulode Mestre em Ciências em Engenharia Elétrica.
Orientador: Rosângela Fernandes Coelho - Docteur ENST
Rio de Janeiro
2014
c2014
INSTITUTO MILITAR DE ENGENHARIAPraça General Tibúrcio, 80-Praia VermelhaRio de Janeiro-RJ CEP 22290-270
Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-loem base de dados, armazenar em computador, micro�lmar ou adotar qualquer forma dearquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecasdeste trabalho, sem modi�cação de seu texto, em qualquer meio que esteja ou venha aser �xado, para pesquisa acadêmica, comentários e citações, desde que sem �nalidadecomercial e que seja feita a referência bibliográ�ca completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es) e do(s)orientador(es).
xxxx Dranka Junior, E.Localização de Fontes de Sinais em Presença de Distorções
Acústicas Não-Estacionárias com uso de sensores fracionários /Eloi Dranka Junior. - Rio de Janeiro : Instituto Militar de Engen-haria, 2014.
83 p.: il.
Dissertação (mestrado) - Instituto Militar de Engenharia - Rio
de Janeiro, 2014.
1. Engenharia elétrica - dissertações. 2. Processamento desinais. 3. Localização de fontes Acústicas I. Título II. InstitutoMilitar de Engenharia.
CDD 621.3822
2
INSTITUTO MILITAR DE ENGENHARIA
ELOI DRANKA JUNIOR
LOCALIZAÇÃO DE FONTES DE SINAIS EM PRESENÇA DEDISTORÇÕES ACÚSTICAS NÃO-ESTACIONÁRIAS COM
USO DE SENSORES FRACIONÁRIOS
Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétricado Instituto Militar de Engenharia, como requisito parcial para obtenção do título deMestre em Ciências em Engenharia Elétrica.
Orientador: Rosângela Fernandes Coelho - Docteur ENST
Aprovada em 03 de Fevereiro de 2014 pela seguinte Banca Examinadora:
Rosângela Fernandes Coelho - Docteur ENST do IME - Presidente
Marley Maria Bernardes Rebuzzi Vellasco - PhD da PUC/Rio
Paulo Fernando Ferreira Rosa - PhD do IME
Paulo César Pellanda, Dr. ENSAE do IME
Rio de Janeiro2014
3
AGRADECIMENTOS
Agradeço primeiramente a Deus por ter me dado esta oportunidade única de realizar uma
pós-graduação.
À Prof. Rosângela, minha orientadora, que desde o início não me negou atenção, me
mostrou o correto caminho a ser seguido e impôs necessária cobrança para que este tra-
balho fosse concluído da melhor maneira possível.
À minha esposa, Tita, que me acompanhou no decorrer desta jornada e me confortou nos
momentos mais difíceis.
Aos meus pais, que desde cedo me incentivaram a seguir o caminho dos estudos e sempre
me apoiaram em minhas decisões.
Aos companheiros de Laboratório, Leonardo Zão e Rodrigo Tavares, que em muito me
ajudaram no decorrer deste trabalho.
E a todos os professores do IME que colaboraram para que eu pudesse chegar ao �nal
desta jornada.
4
SUMÁRIO
LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
LISTA DE SIGLAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2 Resultados Obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 LOCALIZAÇÃO DE FONTES ACÚSTICAS: CONCEITOS E
DEFINIÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1 Localização baseada em TDE: de�nição e métodos . . . . . . . . . . . . . . . . . . . . . 23
2.2 Localização baseada em Energia: de�nição e métodos . . . . . . . . . . . . . . . . . . 28
2.3 Desa�os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 LOCALIZAÇÃO DE FONTES BASEADA NO RETARDO TEM-
PORAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1 Método de localização acústica SRP-PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.1 Estimador de retardo temporal PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.2 Localizador de fontes Acústicas baseado no SRP . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Proposta de Localização de Fontes Acústicas - Método SRP-H-PHAT . . . . 39
3.2.1 Expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.2.2 Estimação do expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.3 Ruído fracionário Gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.4 Estimador de retardo temporal H-PHAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.5 Índice de Não-Estacionariedade (INS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5
3.3 Resultados de Localização Acústica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.1 Cenário dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.2 Estimação do INS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3.3 Estimação do expoente de Hurst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.4 Resultado da localização do SRP-PHAT com ruídos reais e ruído
descorrelatado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.5 Resultados de localização com o método Proposto SRP-H-PHAT . . . . . . . . 55
3.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 LOCALIZAÇÃO DE FONTES BASEADA EM ENERGIA ACÚS-
TICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.1 Método ML-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Método Proposto H-ML-Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3 Resultados dos Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3.1 Distância de Bhattacharyya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3.2 Cenário dos experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3.3 Resultados do ML-Energia com ruídos reais . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.3.4 Resultados de localização do método proposto H-ML-Energia . . . . . . . . . . . 70
4.3.4.1 Comparação dos métodos de Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1 Sugestões para trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.2 Comentários Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6 REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6
LISTA DE ILUSTRAÇÕES
FIG.2.1 Duas arquiteturas empregadas nos sistemas de localização de fontes
acústicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
FIG.2.2 Correlação cruzada entre dois sinais defasados de τ = 100 ms. O
ponto de máximo da correlação corresponde ao valor do retardo
entre eles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
FIG.2.3 Exemplo de uma localização EBL. A fonte é representada pelo
quadrado vermelho. Os sensores são indicados pelos círculos e
os asteriscos ilustram as posições estimadas para a fonte a cada
quadro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
FIG.3.1 Lugar geométrico dos pontos com mesmo valor da função SRP de
um ponto que passe pela posição da fonte gerada para uma fonte
única e dois sensores. (a)Hiperboloide em 3D; (b)Hiperboloide em
3D cortado por um plano; (c)Hipérbole em 2D resultante do corte.
Figura extraída de (VELASCO, 2012). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
FIG.3.2 Lugar geométrico dos pontos com mesmo valor da função SRP de
um ponto que passe pela posição da fonte gerada para uma fonte
única e dois pares de sensores independentes. (a)Hiperboloide em
3D; (b)Hiperboloide em 3D cortado por um plano; (c)Hipérbole
em 2D resultante do corte. Figura extraída de (VELASCO, 2012). . . . . 39
FIG.3.3 Representação de uma função SRP gerada da leitura de 3 sensores
durante a localização do sinal, cuja fonte geradora está localizada
na posição (2,6 ; 2,6). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
FIG.3.4 Decomposição de um sinal pela transformada wavelets discreta em
3 escalas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
FIG.3.5 Etapa �nal do processo de estimação (regressão linear) de H de 3
sinais arti�ciais. Os valores verdadeiros de H de cada sinal são
(a)H = 0, 2, (b)H = 0, 5 e (c)H = 0, 8. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
FIG.3.6 Resultado da estimação dos valores de INS dos sinais acústicos reais,
(a)Avião, (b)Balbúrdia, (c)Motoserra, (d)Helicóptero, (e)Voz e
(f)Metralhadora. A linha em vermelho representa os valores de
7
INS e o tracejado em verde, os valores de limiar de estacionaridade. . . . 48
FIG.3.7 Resultado da estimação dos valores de INS dos ruídos acústicos
reais, (a)Carro, (b)Navio, (c)Veículo Militar, (d)F16, (e)Míssil e
(f)Assovio. A linha em vermelho representa os valores de INS e o
tracejado em verde, os valores de limiar de estacionaridade. . . . . . . . . . . 49
FIG.3.8 Espectrogramas dos sinais e ruídos acústicos. . . . . . . . . . . . . . . . . . . . . . . . 50
FIG.3.9 Estimação do expoente de Hurst para as fontes (a)Avião e
(b)Metralhadora, considerando quadros de 1024, 2048 e 4096
amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
FIG.3.10 Resultado da localização de fonte usando método SRP-PHAT e
SRP com ruídos reais. As linhas em azul indicam a média de
acertos de localização. As linhas em vermelho são as médias de
acertos obtida considerando ruído descorrelatado. A �gura ilustra
a média de acertos de localização das fontes Motoserra (a) e (b),
Balbúrdia (c) e (d) e Avião (e) e (f). Os grá�cos (a), (c) e (e)
mostram o resultado com blocos de 2048 amostras, já (b), (d)
e (f) apresentam-no para a localização realizada com quadros de
4096 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
FIG.3.11 Comparação entre localização obtida pelos métodos SRP-PHAT e
SRP-H-PHAT com quadros de N = 2048 amostras. A linha em
azul mostra o resultado médio obtido na localização das fontes
quando o ruído real é empregado. Já o traço em verde representa
a meta que se deseja alcançar no método de localização. . . . . . . . . . . . . . 58
FIG.3.12 Comparação entre localização obtida pelos métodos SRP-PHAT e
SRP-H-PHAT com quadros de N = 4096 amostras. A linha em
azul mostra o resultado médio obtido na localização das fontes
quando o ruído real é empregado. Já o traço em verde representa
a meta que se deseja alcançar no método de localização. . . . . . . . . . . . . . 59
FIG.4.1 Resultado da localização utilizando ML-Energia com ruídos reais.
Os histogramas mostram o erro de estimação de�nido na EQ. 4.19,
para cada fonte corrompida com um determinado ruído, men-
cionado na legenda, a um valor de SNR de 5 dB. . . . . . . . . . . . . . . . . . . . 68
8
FIG.4.2 Resultado da localização utilizando ML-Energia com ruídos reais.
Os histogramas mostram o erro de estimação de�nido na EQ. 4.19,
para cada fonte corrompida com um determinado ruído, men-
cionado na legenda, a um valor de SNR de 10 dB. . . . . . . . . . . . . . . . . . . 69
FIG.4.3 Resultado da localização utilizando ML-Energia com ruídos reais
e H-ML-Energia. Os histogramas mostram o erro de estimação
de�nido na EQ. 4.19, para cada fonte corrompida com um deter-
minado ruído, mencionado na legenda, a um valor de SNR = 5
dB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
FIG.4.4 Distância de Bhattacharrya entre ML-Energia e ruídos reais (em
vermelho) e H-ML-Energia e ruídos (linhas azuis), para os valores
de SNR entre 0 dB e 20 dB e quadros de 2048 amostras. . . . . . . . . . . . . 74
FIG.4.5 Distância de Bhattacharrya entre ML-Energia e ruídos reais(em
vermelho) e H-ML-Energia e ruídos (linhas azuis), para os valores
de SNR entre 0 dB e 20 dB e quadros de 4096 amostras. . . . . . . . . . . . . 75
FIG.4.6 Comparação entre os métodos ML-Energia, H-ML-Energia e a lo-
calização com ruídos reais para as fontes Avião e Voz. A linha
em verde mostra o RMSE obtido quando as fontes são distorcidas
por ruídos reais. Em vermelho é indicado o RMSE obtido na lo-
calização usando o ML-Energia, que considera ruído aditivo sem
correlação. O método H-ML-Energia tem seus valores de RMSE
representados pela linha azul. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9
LISTA DE TABELAS
TAB.3.1 Descrição e forma de emprego dos sinais e ruídos selecionados para
o trabalho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
TAB.3.2 Estimação de H: Filtros e escalas utilizados no estimador wavelets
para cada sinal e ruído. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
TAB.3.3 Acurácia da localização com grau de con�ança de 95% . . . . . . . . . . . . . . . 47
TAB.3.4 Valores do expoente de Hurst estimado de cada sinal e ruído acús-
tico, em ordem crescente de H. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
TAB.3.5 Estimação de H do sinal corrompido por ruído aditivo. . . . . . . . . . . . . . . 52
TAB.3.6 Resultado SRP-PHAT com ruídos reais e branco. Localização rea-
lizada por quadros de 1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
TAB.3.7 Resultado SRP-H-PHAT. Localização realizada por quadros de
1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
TAB.4.1 Resultados da distância de Bhattacharyya calculada entre os his-
togramas de erro obtidos pelo ML-Energia e pelo H-ML-Energia,
quando comparados com os histogramas de erro de localização com
ruídos reais. O tamanho do quadro considerado para este caso é o
de 1024 amostras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
10
LISTA DE SIGLAS
DOA Direction of Arrival
EBL Energy Based Localization
EM Espectation Maximization
ER-NLS Energy Ratio Nonlinear Least Square
ER-NS Energy Ratio Least Square
ES Exaustive Search
fGn fractionary Gaussian noise
FLOS-FHAT fractionary Lower Order Statistics Phase Transform
GCC Generalized Cross-Correlation Function
GD Gradient Descent
INS Index of Non-Stationarity
LS Least Squares
ML Maximum Likelihood
MR Multiresolution
PHAT Phase Transform
QE Quadratic Elimination
RMSE Root Mean Squared Error
SCOT Smoothed Coherence Transform
SRC Stocastic Region Contraction
SRP Steered Power Response
TDE Time Delay Estimation
11
RESUMO
Nesta Dissertação, são estudadas soluções para melhorar a localização de fontes acús-tica quando a distorção que perturba o sistema é causada por ruídos reais, ou seja, cor-relacionados com a fonte de sinal. Dentro das técnicas de localização de fonte baseadasna estimação do retardo temporal, é proposto um método denominado SRP-H-PHAT,que utiliza a correlação existente entre sinal e ruído para melhorar o modelo de estima-ção de retardos temporais. Considerando os métodos de localização baseados em energiaacústica, é apresentado um método denominado de H-ML-Energia que considera em seumodelo, a correlação existente entre sinal e ruído.
Para avaliação dos métodos propostos, diversos sinais e ruídos acústicos são sele-cionados, com diferentes índices de não-estacionaridade. Os métodos propostos foramempregados na localização de fontes acústicas para distintos valores de razão sinal-ruído,e os resultados comparados com os métodos que apresentam melhores resultados na lite-ratura. O método SRP-H-PHAT apresentou resultados de localização mais próximos deuma situação onde os sinais são corrompidos por ruídos reais do que o método SRP-PHAT,que considera a distorção do sistema como um ruído branco. O método H-ML-Energiamostrou-se mais adequado para localização de fontes cujos sinais estão em presença deruídos reais do que o método ML-Energia, mesmo em situações onde tanto o sinal dafonte quanto o ruído acústico são altamente não-estacionários.
12
ABSTRACT
This work proposes two solutions to improve the localization of sound sources con-sidering that the system is disturbed by real noise, i.e., it is correlated with the signalsource. Regarding the source location methods based on the time delay estimation, theSRP-H-PHAT method it is proposed which considers the correlation between signal andnoise to achieve estimation improvement. The other proposal, called H-ML-Energy, alsoconsiders in its model the correlation between signal and noise to estimate the sourcelocation based on the acoustic energy.
For the evaluation experiments, several signals and acoustic noises are selected withdi�erent indices of non-stationarity. The proposed methods were employed on the locationof sound sources for di�erent values of signal to noise ratio, and the results comparedwith other methods available in the literature. The SRP-H-PHAT localization results arecloser to those obtained with signals corrupted by real noise than SRP-PHAT method,which considers the distortion of the system as white noise. Moreover, the H-ML-Energymethod was more suitable for locating sources whose signals are in the presence of realnoise than ML-Energy, even when both the source signal and the acoustic noise are highlynon-stationary.
13
1 INTRODUÇÃO
O avanço da tecnologia de sensores acústicos e de baixo custo, popularizou a sua inte-
gração em aparelhos celulares inteligentes (smartphones), tablets, computadores e outros
equipamentos eletrônicos. Este avanço impulsionou a pesquisa por métodos de localiza-
ção de fontes acústicas com aplicações em diversas áreas da ciência. Dentre as aplicações,
destaca-se o emprego da localização acústica em sistemas de sonar e radares (CARTER,
1981), em teleconferências, onde a localização de fonte é utilizada para mover a câmera
de vídeo de forma automática para a pessoa que está falando (WANG, 1997). Na sísmica,
permite a determinação da posição do epicentro de terremotos e explosões subterrâneas
(VALIN, 2003). Na robótica, é utilizada em robôs para que estes identi�quem pessoas ou
obstáculos (CHUNG, 2012). Nos sistemas de vigilância, a localização é empregada para
detectar e monitorar objetos dentro de uma determinada região (PATWARI, 2005). Na
estimação de condições climáticas (ROGERS, 2012), os princípios da localização de fontes
acústicas são adotados para determinar o per�l de temperatura e a velocidade dos ventos
de uma dada região.
As fontes acústicas reais (sinais e ruídos), podem ser dos mais variados tipos, como por
exemplo, aviões, carros, pessoas conversando, música, buzinas, armas de fogo, animais,
dentre outros. Estas apresentam diferentes características espectrais (cor do espectro de
frequência) e temporais (distribuição de amplitudes). Além disto, muitos dos sinais acús-
ticos reais são não-estacionários e impulsivos. Este é um aspecto interessante e desa�ador
para a área de processamento de sinais.
O objetivo de uma localização acústica é determinar a posição geográ�ca de uma
fonte de sinal por meio da captura de suas emissões acústicas. O principal desa�o da
área é que o sistema estime a posição da fonte de forma precisa, mesmo quando o sinal
é corrompido por ruídos acústicos reais, cujas perturbações diminuem a acurácia dos
sistemas de localização. Devido à di�culdade de se caracterizar todos os distintos tipos de
ruídos, os modelos de localização de fonte, por simplicidade teórica, consideram em sua
formulação que o ruído é descorrelatado da fonte de sinal. E, portanto, representado por
um ruído gaussiano de espectro branco. Esta restrição dos modelos é destacada como um
grande desa�o pelos autores nas principais propostas (KNAPP, 1976), (DIBIASE, 2001),
14
(LI, 2003), (SHENG, 2005) apresentadas na literatura. Apesar de ressaltarem que esta
hipótese é de grande restrição em seus modelos, os autores se limitam a utilizá-la para
obtenção de uma solução simples, baseada na teoria do limite central. No entanto, esta
restrição pode provocar severa degradação na determinação da real posição das fontes
quando submetidas a ruídos acústicos reais.
Os principais métodos de localização de fonte acústicas podem ser divididos em dois
grupos: os baseados na estimação dos retardos temporais (TDE - Time Delay Estimation)
e os baseados em energia acústica (EBL - Energy Based Localization). O primeiro grupo
abrange os métodos que utilizam em seu modelo o fato de que o som viaja a uma velocidade
�nita e constante, de modo que um sinal será recebido em instantes diferentes por sensores
posicionados em locais distintos. Da estimação do retardo que existe entre os sinais
recebidos, associado ao conhecimento das posições dos sensores, é possível, por meio de
um modelo, determinar a posição geográ�ca da fonte. O segundo grupo considera métodos
que empregam a energia do sinal para estimar a posição da fonte geradora. Isto é feito
pelo conhecimento de que a energia do sinal decai de forma inversamente proporcional à
distância que percorre. Assim, conhecendo a energia da fonte e a posição dos sensores,
um modelo é aplicável para se determinar onde no espaço está a fonte de sinal. A solução
clássica baseada na determinação do ângulo de chegada (DOA - Direction of Arrival)
(KNAPP, 1976), onde a direção de propagação do sinal é estimada e por triangulação é
determinada uma posição, demonstrou-se adequada apenas para sinais em banda estreita.
Este não se aplica ao foco deste trabalho, onde investiga-se a localização de fontes acústicas
de banda larga.
Os primeiros métodos de localização baseados em TDE, utilizavam a correlação
cruzada dos sinais recebidos por pares de microfones para a estimação do retardo tempo-
ral. Isto é possível pois a correlação de dois sinais, defasados entre si, será máxima para o
valor de intervalo igual ao da defasagem. Entretanto, a distorção dos sinais causada por
ruído aditivo degrada consideravelmente a função de correlação cruzada, di�cultando a
identi�cação do valor de máximo. Visando atenuar este problema, em (KNAPP, 1976),
foi proposta uma maneira de se calcular a função de correlação cruzada no domínio da fre-
quência. Deste modo, tornou-se possível a modi�cação da função de correlação cruzada
para uma forma mais genérica, denominada função de correlação cruzada generalizada
(GCC - generalized cross-correlation). Da necessidade de melhorar a identi�cação do
ponto de máximo da função GCC, foi proposta uma técnica denominada de transfor-
15
mação de fase (PHAT - Phase Transform) (KNAPP, 1976). Idealmente, a aplicação do
PHAT na função GCC transforma a função de correlação cruzada em um impulso unitário
centrado no valor do atraso correspondente. Este solução do PHAT para a estimação do
retardo temporal entre sinais, recebidos por um par de sensores, é interessante pois os
resultados são satisfatórios mesmo em casos onde há presença de reverberação. Contudo,
o método PHAT possui uma forte limitação: o ruído aditivo que perturba o sistema é
considerado como estacionário e descorrelatado do sinal da fonte. Esta situação pode
acarretar em resultados errôneos quando o ruído real difere desta hipótese. Após a esti-
mação dos retardos temporais, um localizador, é utilizado para inferir a posição da fonte.
Os primeiros localizadores foram propostos para uma con�guração de sensores em geome-
tria linear (HAHN, 1973), (CARTER, 1977). Porém, esta exigência o deixa mais restrito,
impossibilitando-o de empregar geometrias mais compactas. Frente a isto, foram propos-
tos algoritmos que consideram que os sensores possam ser posicionados em uma geometria
arbitrária (FANG, 1990), (CHAN, 1994). Embora os dois últimos métodos apresentem
resultados satisfatórios, o localizador proposto em (OMOLOGO, 1997), denominado de
SRP (Steered Response Power) é o que apresenta menores erros de localização dentre eles.
Em (DIBIASE, 2001), foi avaliada a integração dos métodos de estimação de retardos
PHAT com o mecanismo SRP, denominada SRP-PHAT. Os experimentos mostraram que
esta combinação apresenta bons resultados de localização, particularmente, em ambientes
internos, onde há presença de reverberação.
Os métodos baseados na energia acústica surgiram na última década, para aplicação
em ambientes abertos ou urbanos, por meio de redes de sensores sem �o. Para isto, um
modelo de atenuação de energia acústica foi descrito em (LI, 2003). Neste modelo, a
energia da fonte de sinal é relacionada com a posição dos sensores que recebem a energia
do sinal. Embora o modelo resulte em bons resultados na estimação da posição da fonte,
ele possui a mesma restrição dos métodos TDE, que consideram de que o ruído de fundo é
descorrelatado da fonte. Em (LI, 2003), são propostas duas formas de se estimar a posição
da fonte. Uma considera que a posição da fonte é obtida pela máxima verosimilhança (ML
- Maximum Likelihood) de�nida pela atenuação acústica, e esta necessita da energia do
sinal da fonte. A outra maneira, permite que a localização seja estimada sem se conhecer
a energia da fonte, através de leitura das razões das energias entre pares de sensores. Este
segundo método é resolvido pelo critério dos mínimos quadrados (LS - Least Squares),
onde a posição da fonte é obtida pelo ponto que mais se aproxima de regiões do espaço
16
de�nidas em função da con�guração dos sensores. Em (SHENG, 2005), o método ML foi
aprimorado, e estendido para o caso em que múltiplas fontes de sinal estão inseridas no
campo de sensores. Os autores mostraram que este método, denominado ML-Energia,
apresenta resultados de localização superiores em relação ao ML e aos métodos LS.
Nesta Dissertação, são propostas duas soluções para prover robustez à localização de
fonte, mesmo quando o sinal é corrompido por ruídos acústicos reais. A primeira proposta,
denominada SRP-H-PHAT, é baseada em TDE e apresenta uma nova formulação para
a função de correlação cruzada, baseada no expoente de Hurst (H) (HURST, 1951),
(MANDELBROT, 1968). O expoente de Hurst permite a representação de todos os graus
de correlação entre sequências amostrais. Adicionalmente, no modelo SRP-H-PHAT, a
correlação cruzada dos sinais e ruídos é representada por um processo fracionário gaussiano
(fGn - fractional Gaussian Noise). A segunda proposta, denominada H-ML-Energia,
aplicada ao método de localização EBL apresenta uma nova representação da função
estocástica de erro para o modelo de atenuação de energia, empregando também o fGn.
Isto possibilita que seja incluído na localização, os efeitos da correlação existente entre
sinal e ruído.
Os métodos propostos nesta Dissertação foram avaliados em diversos experimentos,
considerando seis sinais acústicos reais (Avião, Balbúrdia, Voz, Metralhadora, Helicóptero
e Motoserra) e seis ruídos reais (Carro, F16, Navio, Veiculo Militar, Míssil e Assovio),
selecionados de distintas bases de sinais acústicos. Os sinais foram corrompidos com
cada um dos ruídos, para distintos valores de razão sinal ruído (SNR - Signal to Noise
Ratio), entre 0 dB e 20 dB, com intervalos de 5 dB. Além disso, diferentes tamanhos de
quadros (1024, 2048 e 4096 amostras) foram empregados nos experimentos localização. O
critério de seleção dos sinais e ruídos foi adotado de modo a se ter uma maior divergência
de características espectrais e temporais, e assim permitir a obtenção de um cenário
distinto e mais vasto. Adicionalmente, o índice de não-estacionariedade (INS - Index
of Non-Stationarity) (BORGNAT, 2010) de cada sinal e ruído foi estimado e avaliado o
seu impacto no desempenho dos métodos de localização. Para o estudo comparativo, os
métodos SRP-PHAT e ML-Energia foram implementados, e os resultados de localização
foram obtidos e confrontados com os métodos propostos nesta Dissertação.
17
1.1 OBJETIVOS
Os principais objetivos deste trabalho são:
• Investigar a in�uência do INS dos sinais no desempenho dos métodos de localização
de fontes acústicas.
• Analisar a estrutura de correlação (H) dos sinais e ruídos acústicos reais, bem como
dos sinais quando corrompidos por ruídos reais, para distintos valores de SNR.
• Investigar a in�uência dos ruídos acústicos reais no desempenho dos métodos de
localização de fonte que consideram que o ruído é descorrelatado. Tanto os métodos
baseados em TDE quanto os EBL serão considerados para esta análise.
• Propor um método de localização de fontes acústicas baseado em TDE que leva
em consideração a correlação existente entre sinal e ruído, por meio de um novo
estimador de retardos temporais, que utiliza o expoente de Hurst em sua formulação.
• Propor um método de localização de fontes acústicas baseado em energia acústica,
que utiliza um fGn para representar a função estocástica de erro para o modelo de
atenuação de energia.
• Avaliar a robustez dos métodos propostos através do uso de sinais e ruídos acústi-
cos reais, com distintas características de correlação e não-estacionaridade, onde os
sinais são corrompidos pelos ruídos para diversos valores de razão sinal ruído.
1.2 RESULTADOS OBTIDOS
Os principais resultados e contribuições obtidos no desenvolvimento desta Dissertação
são:
• Proposta de um método de localização baseado na estimação dos retardos temporais
que considera que o ruído que distorce os sensores é correlatado com o sinal da fonte.
Os resultados obtidos dos experimentos mostram que o método proposto apresenta
resultados mais próximos aos apresentados pela localização com ruídos reais do que
o método SRP-PHAT, que considera o ruído de fundo descorrelatado.
18
• Proposta de um método de localização baseado em energia acústica que considera
que o ruído que distorce os sensores é correlacionado com o sinal da fonte. Os
experimentos realizados mostram que o método proposto apresenta resultados mais
próximos aos obtidos de uma localização com ruídos reais do que o método ML-
Energia, que modela o erro por um ruído branco.
• Constatação de que sinais com maior índice de não-estacionariedade apresentam
mais erros na sua localização do que os de menor INS.
• Constatação de que sinais com valores de INS elevados apresentam uma maior va-
riância de seu parâmetro H, quando o mesmo é analisado por quadros de curta
duração.
• Veri�cação de que a correlação existente entre sinais e ruídos acústicos reais in�u-
encia nos resultados de localização dos métodos que consideram que a distorção é
causada por ruído branco.
1.3 ORGANIZAÇÃO DA DISSERTAÇÃO
O restante deste trabalho está organizado da seguinte forma:
• Capítulo 2: Neste Capítulo, são introduzidos os conceitos fundamentais acerca dalocalização de fontes acústicas. Ainda neste Capítulo, são apresentados os princi-
pais métodos existentes de localização, onde suas características e limitações são
abordadas de forma sucinta.
• Capítulo 3: Neste Capítulo, a localização de fontes baseada em estimação de
retardo temporal é apresentada com maior profundidade. O estado da arte é apre-
sentado, bem como suas características e limitações. Em seguida, o método de
localização de fontes baseado em retardo temporal, SRP-H-PHAT, é apresentado.
Finalmente, são mostrados os resultados dos diversos experimentos realizados para
a avaliação do SRP-H-PHAT.
• Capítulo 4: Neste Capítulo, é realizado um detalhamento do ML-Energia, principal
método de localização de fontes baseado na energia acústica. Uma análise detalhada
do ML-Energia expõe suas qualidades e limitações. Em seguida, a proposta de
19
método de localização baseado em energia é apresentada e ao �nal do Capítulo, os
resultados dos experimentos realizados para avaliação da proposta são reportados.
• Capítulo 5: Finalmente, este Capítulo expõe as principais conclusões e con-
tribuições desta Dissertação. O Capítulo também resume as principais atividades
desenvolvidas e aponta sugestões para trabalhos futuros de forma a estender os
resultados obtidos neste trabalho.
20
2 LOCALIZAÇÃO DE FONTES ACÚSTICAS: CONCEITOS E
DEFINIÇÕES
A localização de fontes acústicas é um segmento da área de processamento de sinais
que tem por objetivo determinar a posição geográ�ca de uma fonte de sinal através da
captura de suas emissões acústicas. Para isto, o sinal da fonte precisa ser recebido por
sensores acústicos, cujas posições necessariamente precisam ser conhecidas pelo sistema
de localização.
Um dos grandes desa�os da área é que o sistema de localização de fontes deve apre-
sentar a estimação da posição da fonte de forma rápida, em tempo real, com robustez
e com o menor erro de precisão possível. A presença de ruídos acústicos é o principal
desa�o para a acurácia dos sistemas de localização. Outros fatores como a amostragem e
a discretização do sinal e, ainda, os modelos empregados para a estimação da posição da
fonte podem afetar a determinação da posição correta da fonte. Devido a di�culdade de se
caracterizar todos os distintos tipos de ruídos nos modelos de localização de fonte, é usual
que se considere nos modelos de localização de fontes, que o ruído seja descorrelatado
da fonte de sinal, ou seja, um ruído gaussiano branco. Porém, várias pesquisas mostram
que os ruídos acústicos reais não são gaussianos ou brancos (WEBSTER, 1993), (MING,
2007), (ZÃO, 2012). Assim, é esperado que as posições de fontes obtidas em um sistema
de localização com distorções representadas por um ruído gaussiano branco, sejam muito
diferentes quando submetidas a um ambiente onde há presença de ruído acústico real.
Uma fonte acústica pode ser qualquer objeto ou ser vivo que emita sinais como, por
exemplo, um carro ou uma pessoa. Os sensores são circuitos eletrônicos, dotados de
microfones omnidirecionais, ou seja, que permitem a captura do som de qualquer direção.
Geralmente, os sistemas são classi�cados segundo a arquitetura dos sensores em dois
tipos: conjunto de microfones em geometria �xa e rede de sensores sem �o. Os conjuntos
de microfones são construídos em uma estrutura �xa, de geometria simétrica (circular,
esférica, linear, triangular e retangular), cujos sensores são todos conectados a um proces-
sador central. Este é responsável por amostrar e digitalizar os sinais de cada microfone,
e estimar a posição da fonte. Este tipo de arquitetura, apesar de ser mais simples de se
construir, exige uma maior largura de banda do canal de comunicação, pois existe ne-
21
(a) Conjunto de sensores em geometria �xa (b) Rede de sensores sem �o
FIG. 2.1: Duas arquiteturas empregadas nos sistemas de localização de fontes acústicas.
cessidade de se transmitir todos os sinais para o processador central. Esta arquitetura
de sensores é geralmente adotada para localização em ambientes fechados ou internos.
Já em uma arquitetura de redes de sensores sem �o, os microfones são posicionados em
posições arbitrárias dentro de um campo de sensores. A comunicação é realizada entre
os sensores, que trocam informações sobre o sinal recebido e acerca de sua própria situ-
ação, como por exemplo, sua posição geográ�ca. Este ambiente de troca de informações
é conhecido como rede colaborativa, onde o processador central, embora ainda exista,
não precisa se comunicar com todos os sensores para receber suas informações. A grande
vantagem desta arquitetura é a e�ciência na comunicação, pois geralmente os sensores
realizam o processamento do sinal de forma descentralizada e transmitem apenas a in-
formação necessária, para que o órgão central possa efetuar a localização. Um requisito
dos sensores sem �o, cuja alimentação geralmente é realizada por meio de baterias, é a
necessidade de algoritmos de troca de informações e de captura de dados que sejam mais
e�cientes em termos de economia de energia (LI, 2002). Esta arquitetura de sensores é
geralmente adotada para localização em ambientes abertos ou urbanos.
A FIG. 2.1(a) ilustra a arquitetura de um conjunto de sensores organizado em ge-
ometria retangular, enquanto na FIG. 2.1(b), os sensores estão organizados em uma rede
sem �o. Nesta última con�guração, os sensores não precisam obedecer uma geometria
especí�ca.
Os métodos de localização de fontes acústicas podem ser divididos em dois grandes
grupos: os baseados na estimação do retardo temporal (TDE - Time Delay Estimation) e
os baseados na estimação da energia ou intensidade acústica do sinal (EBL - Energy Based
Localization). Independente do sistema adotado (TDE ou EBL), a localização de fontes
acústicas deve englobar duas etapas. Na primeira, é estimada a grandeza física (retardo
ou energia) de interesse, adotada pelo método de localização empregado. A segunda etapa
consiste em localizar a posição geográ�ca da fonte acústica propriamente dita.
22
Os métodos baseados em TDE (KNAPP, 1976) foram inicialmente propostos para
ambientes fechados ou internos, onde havia o interesse de localizar fontes de forma mais
precisa. Os sistemas de localização baseados em TDE geralmente utilizam arquitetura de
sensores de�nida por um conjunto de microfones em geometria �xa.
Os métodos baseados na energia acústica foram propostos mais recentemente, para
a localização de fontes acústicas em ambientes externos e mais amplos. O conceito de
EBL surgiu em um cenário de substituição dos sensores em geometria �xa pelas redes de
sensores sem �o.
2.1 LOCALIZAÇÃO BASEADA EM TDE: DEFINIÇÃO E MÉTODOS
Os sinais acústicos se propagam no espaço com uma velocidade �nita, usualmente
aproximado para 343 metros por segundo. Sendo assim, dois sensores que se encontrem
a distâncias distintas em relação a uma determinada fonte de sinal, irão receber suas
emissões acústicas em instantes diferentes. Conhecendo-se a posição relativa entre os
sensores, é possível estimar esta diferença de tempo, que é conhecida como retardo ou
atraso temporal. Por meio da combinação de várias estimações de retardos, pode-se, em
uma segunda fase, localizar geogra�camente a posição da fonte.
Considere uma fonte acústica, cuja posição geográ�ca seja dada pelo vetor rs =
(xs, ys, zs). Um sensor i, posicionado no ponto de coordenadas (xi, yi, zi), representado
pelo vetor ri irá receber o sinal da fonte com um retardo de tempo dado por
τi =|rs − ri|
c, (2.1)
onde c representa a velocidade de propagação do som. Para um par de sensores a e b,
pode-se determinar o retardo temporal relativo entre eles, τab = τa − τb. Logo,
τab =|rs − ra|
c− |rs − rb|
c. (2.2)
Por meio da combinação de várias estimações de retardos, pode-se, em uma segunda fase,
localizar geogra�camente a posição da fonte.
A estimação do retardo temporal é realizada por meio de um par de sensores, sendo
o principal método de obtenção deste retardo, a função de correlação cruzada dos sinais
recebidos em cada sensor. O valor máximo desta função ocorre exatamente no intervalo
(lag) correspondente ao retardo temporal que se deseja estimar. Sejam dois sinais digitais
23
(a) Sinal recebido no sensor a (b) Sinal recebido no sensor b
(c) Correlação cruzada entre os dois sinais
FIG. 2.2: Correlação cruzada entre dois sinais defasados de τ = 100ms. O ponto de máximo da correlaçãocorresponde ao valor do retardo entre eles.
defasados entre si, s(n) e s(n−τ), respectivamente. A função de correlação cruzada destes
sinais é de�nida por
R(k) =∞∑
n=−∞
s(n)s(n− τ + k), (2.3)
onde k é o intervalo (lag) da função de correlação cruzada e τ é o retardo temporal entre
os sinais defasados. O valor de máximo desta função é dado para k = τ , ou seja,
R(k = τ) =∞∑
n=−∞
s(n)s(n) =∞∑
n=−∞
s2(n). (2.4)
Logo, conhecendo-se o valor de máximo de uma função de correlação cruzada, pode-se
estimar o retardo existente entre dois sinais recebidos pelo par de sensores. Por exemplo,
considere um sinal recebido em dois sensores (a e b), nos instantes ta = 0 ms e tb = 100 ms,
respectivamente. A representação dos sinais recebidos em cada um destes sensores está
ilustrada na FIG. 2.2. A função de correlação cruzada dos sinais também é apresentada na
FIG. 2.2(c). Observe que o valor de máximo da função de correlação cruzada se encontra
no valor de k = −100, que corresponde ao retardo temporal entre os sinais captados pelos
sensores.
Embora a função de correlação cruzada forneça uma indicação de atraso precisa para
o caso ideal, onde não há presença de ruído, em situações reais, esta é afetada e, con-
sequentemente, acarretará em erro na estimação do retardo temporal. Além do ruído
24
acústico, em ambientes fechados ou internos, pode ocorrer a reverberação1, que faz com
que múltiplos picos ocorram na função de correlação cruzada, prejudicando a estimação
do retardo.
Com objetivo de reduzir a in�uência da reverberação e do ruído acústico, o principal
estimador de retardo temporal baseado em correlação cruzada foi proposto em (KNAPP,
1976). Neste, a função de correlação cruzada é calculada no domínio da frequência e
denominada função de correlação cruzada generalizada (GCC - generalized cross correla-
tion). O objetivo da função GCC é realçar determinados aspectos da função de correlação
cruzada, como por exemplo, facilitar a estimação do valor de máximo. Considere um sinal
temporal de uma fonte s(n), recebido por um par de sensores (a e b),
xa(n) = s(n) + wa(n) (2.5)
xb(n) = s(n+ τ) + wb(n), (2.6)
onde wa(n) e wb(n) são, por simplicidade, ruídos assumidos como estacionários e gaus-
sianos e τ denota o retardo percebido devido ao tempo necessário que o som leva para
percorrer a distância entre a fonte e o centro do segmento de reta que une os dois sensores.
A função GCC é obtida por meio da transformada de Fourier dos sinais recebidos pelos
sensores, do seguinte modo,
RGCC(τ) = F−1 {Xa(k)X∗b (k)} , (2.7)
onde Xa(k) e Xb(k) representam os sinais xa(n) e xb(n) no domínio da frequência, respec-
tivamente, F−1{.} denota a transformada inversa de Fourier e ∗ o complexo conjugado.
A RGCC(τ) apresenta características distintas de uma função de correlação cruzada con-
vencional, caso alguma ponderação seja feita no domínio da frequência, antes de se aplicar
a transformada inversa de Fourier. Esta operação é usualmente chamada de �ltragem, por
ser realizada no domínio da frequência. A transformação de fase (PHAT - Phase Trans-
form) (KNAPP, 1976), realiza uma suavização dos componentes espectrais da função
GCC, obtida através da divisão do espectro pelo seu módulo, mantendo apenas a fase do
sinal. Deste modo,
RPHAT(τ) = F−1{Xa(k)X∗b (k)
|Xa(k)Xb(k)|
}. (2.8)
1A reverberação acústica ocorre devido à existência de obstáculos que re�etem um sinal acústico.
Assim, um sensor irá receber além do sinal original, uma cópia do mesmo com um retardo devido ao
tempo entre a re�exão (KINSLER, 1982).
25
Uma característica interessante do método PHAT é que este reduz consideravelmente
a in�uência da reverberação na estimação dos retardos temporais (KNAPP, 1976), mesmo
para situações de baixo valor de SNR. No entanto, sua limitação está na formulação que
considera a descorrelação entre sinal e ruído. Ou seja, o ruído é de�nido como aditivo
gaussiano branco. Em (DONOHUE, 2007), foi proposta uma variação do método PHAT,
denominado como PHAT-β. Nesta solução é proposta uma suavização parcial do espectro
da função GCC, em função do valor de β (0 < β < 1). Uma escolha apropriada do valor
de β pode acarretar em melhora da estimação do retardo temporal. Uma outra variação
do PHAT denominada de transformação de fase baseada em estatísticas de ordens fra-
cionárias (FLOS-PHAT - fractionary Lower Order Statistics), foi proposta em (GEOR-
GIOU, 1999). O objetivo do método era melhorar a estimação dos retardos quando o
ruído que distorce os sensores é considerado impulsivo, com distribuição de amplitudes
caracterizadas por um processo α-estável (NIKIAS, 1995), (SAMORODNITSKY, 1994).
Os resultados obtidos pelos autores mostraram que o FLOS-PHAT é apenas superior ao
PHAT quando o ruído possui distribuição α-estável, e para valores de 1 ≤ α ≤ 1, 4. Esta
hipótese nem sempre é verdadeira. Sabe-se também que distribuição de amplitudes de um
ruído di�cilmente será conhecida a priori em um cenário real de localização. Além disto,
a correlação existente entre sinal e ruído também foi desprezada no método FLOS-PHAT.
A segunda etapa de um sistema de localização de fonte acústica consiste na localização
propriamente dita. Ou seja, após a estimação dos retardos temporais obtidos na primeira
etapa, deve-se obter uma estimativa da posição geográ�ca ou espacial da fonte do sinal.
Um dos primeiros métodos de localização propostos foi apresentado em (HAHN, 1973),
denominado de localizador de azimute e distância, pois foi proposto em termos de coorde-
nadas polares. Este método foi amplamente empregado em sistemas de radar e sísmicos.
A desvantagem deste localizador é a necessidade de que as fontes a serem localizadas,
estejam situadas a uma grande distância dos sensores. Além disto, o método exige que
os sensores sejam posicionados em uma con�guração linear, ou seja, sobre uma reta. O
método apresentado em (CARTER, 1977) também emprega sensores em con�guração
linear mas permite localizar fontes que estejam próximas aos sensores. Porém, para apre-
sentar bons resultados na estimação, é necessário que a con�guração dos sensores seja
simétrica, o que torna o seu emprego muito restrito a uma determinada aplicação.
Quando o conjunto de sensores é con�gurado em uma geometria arbitrária, diferente
da linear, a localização da fonte é encontrada através da interseção de um conjunto de
26
curvas hiperbólicas. Para este caso, a solução proposta em (FANG, 1990), apresenta uma
forma fechada para encontrar a posição da fonte, em função dos retardos e das posições dos
sensores. Embora a proposta apresente bons resultados, esta considera apenas o número
mínimo de leituras exigido para a localização, ou seja, 3 microfones para a localização
em duas dimensões e 4 para três dimensões. Isto signi�ca que o método não aprimora
os resultados de localização mesmo quando um maior número de sensores é utilizado
no sistema. Esta limitação foi corrigida na proposta apresentada em (CHAN, 1994).
Entretanto, este último apresenta grande degradação na localização se a posição dos
sensores não for informada precisamente. O localizador baseado na potência de resposta
direcionada (SRP - Steered Response Power) (OMOLOGO, 1997), consiste em uma técnica
de conformação de feixe (beamforming) que utiliza a informação da disposição geométrica
de um conjunto de microfones para determinar a posição espacial da fonte. Isto é obtido
através da análise dos valores da função SRP de�nida pela composição dos sinais recebidos
pelos sensores, dada por,
P (r) =M∑i=0
[τi − τi(r)], (2.9)
onde r é um vetor de posição em coordenadas cartesianas da fonte de sinal, M é o número
de pares de sensores utilizados, τi é o retardo temporal estimado entre o par de sensores
i (i = 1, 2, ...,M) e τi(r) indica o retardo temporal teórico no par de sensor i quando
a fonte está posicionada na posição r. O método SRP apresenta resultados precisos na
localização de fontes, embora exija elevado custo computacional para a busca do valor de
máximo da função.
A combinação do estimador de retardos temporais PHAT com o localizador SRP,
foi proposta em (DIBIASE, 2001) e denominada SRP-PHAT. Ao utilizar a localização
espacial determinada pela função SRP, associada à estimação dos retardos, conferida pelo
PHAT, o SRP-PHAT obtém interessantes resultados na localização acústica, mesmo em
ambientes com reverberação. No entanto, devido ao emprego do PHAT, sua principal
limitação está no fato deste considerar o ruído aditivo como descorrelatado. Além disto,
possui um elevado custo computacional na busca do máximo da função SRP. Diversos
trabalhos foram propostos no intuito de reduzir o custo computacional do SRP-PHAT,
como por exemplo, o modelo de localização híbrida em (PETERSON, 2005). Sua principal
restrição se deve ao fato de conseguir localizar apenas fontes muito próximas do conjunto
de sensores empregados no sistema. Em (DO, 2007), um algoritmo de busca baseado
27
na contração estocástica de regiões (SRC - Stochastic Region Contraction), foi proposto.
Sua ideia é de subdividir a função SRP em regiões de busca, de forma iterativa, onde
de início uma região maior é escolhida, que contém o valor de máximo global. De forma
estocástica, a cada iteração, uma nova região, de menor volume, é selecionada, de modo
que ao �nal, um menor número de buscas são necessárias para a localização da fonte.
Embora os resultado obtidos mostrem que há uma redução do custo computacional, a
base do método é o SRP-PHAT, o que faz com que o SRC herde sua mesma restrição,
quanto a hipótese de descorrelação entre sinais e ruídos.
Neste trabalho, um método de localização baseado em TDE é proposto, cujo principal
objetivo é explorar e representar a correlação entre sinais e ruídos. Para avaliar a proposta,
escolheu-se o SRP-PHAT como referência para a análise comparativa dos resultados de
localização.
2.2 LOCALIZAÇÃO BASEADA EM ENERGIA: DEFINIÇÃO E MÉTODOS
O uso da estimação da energia acústica para localização de fontes (EBL - Energy Based-
Localization), diferentemente dos métodos baseados em TDE, surgiu em um contexto de
localização em ambiente aberto. Neste sistemas, onde grandes distâncias são consideradas,
é exigida uma menor precisão na localização.
A localização de fontes através da estimação da energia, se baseia no fato de que a
intensidade do sinal acústico é atenuada à medida que se distancia da fonte geradora. Por
meio de uma função que relacione a atenuação, e que permita a estimação da energia do
sinal emitido pela fonte, é possível determinar a sua posição. A medição da energia do sinal
recebido é realizada pelos diversos microfones que se encontram em posições conhecidas
pelo sistema. A FIG. 2.3 ilustra um exemplo de localização EBL, onde uma fonte acústica
(representada pelo quadrado) está inserida em um campo de 100 x 80 metros. Para este
exemplo, 4 sensores (representada por círculos) são posicionados em con�guração espacial
arbitrária. Os asteriscos mostram as posições estimadas da fonte durante cinco testes
de localização. Apesar da vasta área do campo de sensores utilizada, percebe-se que as
estimações são próximas da posição real da fonte.
O primeiro método de localização de fontes a utilizar a energia acústica da fonte
emprega o princípio do ponto de aproximação mais próximo (CPA - Closest Point of
Approach) (LI, 2003). No CPA, a ideia básica é considerar que o sensor que apresente o
28
FIG. 2.3: Exemplo de uma localização EBL. A fonte é representada pelo quadrado vermelho. Os sensoressão indicados pelos círculos e os asteriscos ilustram as posições estimadas para a fonte a cada quadro.
maior valor de energia seja aquele que está mais próximo da fonte. Deste modo, pode-se
estimar a posição da fonte através da posição do sensor que receber o sinal da fonte de
forma menos atenuada. Para apresentar resultados satisfatórios, este método necessita
que o campo de sensores possua grande quantidade de elementos.
Ainda em (LI, 2003), foi proposto um método de localização de fontes acústicas, rela-
cionando a energia do sinal acústico da fonte com a sua posição, bem como com as
posições de cada um dos sensores. Assim, considerando uma fonte acústica única, cuja
posição varia no tempo e é representada por p(t), a energia recebida em cada sensor i,
pertencente a uma rede de N sensores, é dada por
ui(t) = gi.B(t− τi)
|p(t− τi)− ri|a+ E[w2
i (t)], (2.10)
onde, ri representa a posição (�xa) de cada sensor i, B(t) é a energia do sinal acústico
gerado pela fonte, τi é o retardo temporal devido a distância que separa a fonte do sensor
i, gi é o ganho de energia do i-ésimo sensor, a é a constante de decaimento e E[w2i (t)] é a
energia do ruído de fundo, considerado como descorrelatado e com distribuição gaussiana.
O modelo de�nido na EQ. 2.10 foi proposto em (LI, 2003), então denominado de modelo de
decaimento da energia acústica, onde a constante de decaimento foi experimentalmente
determinada (aproximadamente igual a 2). Além disto, os autores consideram que a
energia do sinal da fonte varia pouco ao longo de um quadro de localização, o que permite
que se despreze o retardo dos sinais, simpli�cando o modelo proposto. Deste modo, é
possível estimar a energia da fonte acústica, B(t), se a energia do ruído em cada sensor
for considerada com distribuição gaussiana, identicamente distribuída com média µi e
variância σi conhecidas. Logo, cada ui(t) será uma variável aleatória gaussiana com
29
função de probabilidade condicional conjunta dada por
f(u1(t), ..., uN(t)|σ2, B(t),p) ∝ exp
{−1
2
N∑i=1
ui(t)− µi − giB(t)/|p(t)− ri|2
σ2i
}, (2.11)
que corresponde a função de máxima verosimilhança (ML - Maximum Likelihood)
(CHUNG, 2012) e (PAPOULIS, 2002). Logo, maximizar esta função permite que se
estime a energia da fonte de sinais acústicos e, ao mesmo tempo, se determine sua posição
geográ�ca.
Uma segunda alternativa de localização também foi proposta em (LI, 2003), onde a
energia da fonte não precisa ser estimada para que sua posição seja determinada. Para
isto, os autores modi�caram o modelo de decaimento de energia acústica de forma a
eliminar a energia da fonte de sua formulação. Isto é obtido através da leitura de razões
de energia acústica em pares de sensores, denominado de localização por hiperesferas2 de
razões de energia (Energy Ratio Location Hypersphere). Para cada dois sensores i e j, é
tomada a razão, κij entre suas medições de energia. Se o ruído for desprezado, o modelo
do decaimento de energia tem sua forma reduzida a hiperesferas cujos centros (cij), e raios
(δij) são funções da posição da fonte acústica e dos sensores, dados por,
cij =ri − κ2ijrj1− κ2ij
, e δij =κij|ri − rj|
1− κ2ij(2.12)
Portanto, em um campo com N sensores, existem N(N − 1)/2 razões de energia
distintas, que formam N(N−1)/2 hiperesferas, cada uma com função descrita por |r(t)−cij|2 = δ2ij. Da interseção destas hiperesferas, é estimada a localização da fonte.
O modelo das razões de energia foi formulado considerando a inexistência de ruídos
ou distorção acústica. Quando o ruído passa a ser considerado, a posição da fonte deixa
de ser estimada pela interseção das hiperesferas e passa a ser dada pelo ponto de menor
distância entre todas as hiperesferas. Deste modo, a localização da fonte passa a ser um
problema de otimização, onde a função custo J(r) é expressa em termos da posição da
fonte acústica e das razões de energia acústica,
J(r) =N∑i=1
N∑j=1
||r − cij| − δ2ij|2 +N∑i=1
N∑j=1
|(ri − rj)T r −|ri|2 − |rj|2
2|2. (2.13)
2Em um plano, ou seja, em duas dimensões, uma hiperesfera é um círculo. Em três dimensões, uma
hiperesfera é uma esfera.
30
Portanto, a posição estimada da fonte será dada pelo valor de r que minimiza a função
custo J(r). Este método de localização foi denominado pelos autores de método baseado
em razões de energia de mínimos quadrados não-linear (ER-NLS - Energy Ratio Nonlin-
ear Least Square). Uma alteração da função custo foi proposta pelos mesmos autores,
onde os termos não-lineares são cancelados. Esta segunda formulação foi denominada
de método baseado em razões de energia de mínimos quadrados linear (ER-LS - Energy
Ratio Nonlinear Least Square).
Em (LI, 2004), o modelo de hiperesferas de razões é alterado, de modo a permitir que
a posição da fonte possa ser estimada por uma fórmula fechada, ou seja, sem necessidade
de minimização da função custo. Este método foi denominado de eliminação quadrática
(QE - Quadratic Elimination). Embora o baixo custo computacional seja atraente, ele
não apresenta precisão nos resultados de localização quando a razão sinal-ruído é baixa.
Em (SHENG, 2005), o modelo de decaimento da energia acústica foi estendido para o
caso em que múltiplas fontes de sinal estão presentes no campo de localização, e denomi-
nado ML-Energia. Uma função de máxima verosimilhança foi apresentada, onde de sua
maximização, pode-se estimar a energia acústica das K fontes de sinais e ao mesmo tempo
as suas posições. Mais uma vez, a principal restrição deste método, é que ele considera
em sua formulação que o ruído que distorce os sinais recebidos nos sensores é gaussiano
branco, ou seja, desconsidera a correlação existente entre sinal e ruído.
Praticamente todos as propostas de localização EBL (com exceção do QE), necessitam
encontrar o ponto de máximo ou mínimo de uma dada função para estimar a posição da
fonte de sinal. Deste modo, foram propostos alguns métodos de busca, com �nalidade de
não apenas encontrar a solução, mas também de fazê-lo com menor custo computacional
possível, tendo em vista a necessidade de economia de energia presente em uma rede de
sensores.
Para minimizar a função custo do ER-NLS e do ER-LS, foi proposto um algoritmo
de busca exaustiva (ES - Exaustive Search) (LI, 2003). Neste, uma varredura é realizada
ponto a ponto dentre as prováveis posições da fonte no campo de sensores. Apesar de ser
o de implementação mais simples, o tempo para processamento e o custo computacional
são proibitivos para um ambiente de redes de sensores sem �o. Além disto, sua precisão
depende do tamanho da área de varredura, sendo tanto maior quanto menor for esta área.
Com o propósito de reduzir o custo computacional mas ao mesmo tempo manter a
simplicidade da implementação, foi de�nida a busca em multi-resolução (MR - Multireso-
31
lution search) (LI, 2003). Neste caso, a varredura é realizada por busca exaustiva, porém,
inicialmente se emprega uma área de varredura com pontos largamente espaçados, e após
uma primeira iteração, e identi�cação do ponto de máximo, a resolução da busca é au-
mentada e uma nova busca é efetuada ao redor do ponto encontrado. O procedimento é
repetido por diversas vezes, e na iteração �nal, usa-se uma área de busca muito pequena.
A vantagem é a redução do custo computacional, porém, dependendo do valor de SNR,
pode-se selecionar um ponto incorreto na primeira varredura, levando a uma estimação
errada da posição da fonte. Para se perceber a grande vantagem da busca MR em relação
ao ES, considere uma localização de fonte em um campo de sensores bidimensional com
tamanho 100 x 100 metros. Supondo que a busca ES seja realizada em uma área de 1 x
1 metro, então serão analisados 10000 pontos. Se for empregada a busca MR com três
níveis de busca, 10 x 10 metros, seguida por 2 x 2 metros e por �m 1 x 1 metro, serão
analisados no total 100 + 4 + 1 = 129 pontos. A e�ciência computacional é ainda mais
evidente quando a localização é realizada em três dimensões.
O algoritmo de busca baseada no gradiente (GD - Gradient Descent) (LI, 2003) é uma
técnica de otimização onde a direção do mínimo da função é escolhida como a oposta ao
gradiente. Em cada iteração, a posição da fonte será dada segundo a última posição e o
gradiente da função custo,
r(k + 1) = r(k)− λ∇J(r), (2.14)
onde J(r) é a função custo, λ é o fator de convergência escolhido e∇ representa a operação
de gradiente. Deste modo, após algumas iterações, o algoritmo irá convergir para a
solução. Apesar da rápida convergência, é necessário que a posição inicial da fonte seja
escolhida de forma adequada. Para isto, recomenda-se utilizar a busca exaustiva para
gerar uma primeira estimativa da posição da fonte, para então iniciar as iterações do
método GD.
Os autores (LI, 2003) mostraram por meio de experimentos que os algoritmos de busca
baseados no gradiente e o da multi-resolução são os mais adequados para os métodos
EBL. Apesar do MR apresentar resultados levemente inferiores ao GD, ele é computa-
cionalmente menos custoso, sendo por isto, considerado como melhor dentre os dois.
Em (SHENG, 2005), como mais de uma fonte é localizada, os algoritmos de busca
foram modi�cados, sendo propostas uma técnica baseada na maximização da esperança
(EM - Expectation Maximization) e na multi-resolução. Os autores mostraram que para o
ML-Energia, o algoritmo MR apresenta melhores resultados na estimação da posição da
32
fonte do que o EM.
Uma comparação entre os principais métodos de localização de fontes acústicas
quando as mesmas possuem distintas características de impulsividade foi apresentada
em (DRANKA, 2013), onde mostrou-se que quanto mais impulsivo é um sinal, mais erros
ocorrem na estimação da posição da fonte.
Nesta Dissertação, uma proposta de método de localização EBL é apresentada, cujo
principal objetivo é explorar e representar a correção entre sinais e ruídos. Para �ns
de uma análise comparativa da proposta, o ML-Energia foi escolhido, por apresentar
melhores resultados de localização. Apesar do algoritmo de busca EM ser empregado para
maximizar a função ML-Energia, neste trabalho é utilizada a busca em multi-resolução
para a maximização, pois apresentou melhores resultados em termos de convergência, nos
experimentos.
2.3 DESAFIOS
Para os métodos baseados em TDE, o principal desa�o que existe é o fato de se con-
siderar que a distorção causada no sistema é modelada por um ruído gaussiano branco, ou
seja descorrelatado. Esta consideração leva a um modelo menos realístico, que apresenta
erros quando a localização é realizada em um ambiente com presença de ruídos reais. Os
métodos EBL sofrem desta mesma limitação, pois também consideram que a distorção
causada no sistema é modelada por um ruído branco.
2.4 RESUMO
Este Capítulo introduzir a teoria acerca da localização de fontes acústicas. Foi
mostrada a constituição de um sistema de localização de fontes, apresentando as possíveis
disposições dos sensores dentro de um campo de localização. Foram apresentadas as duas
grandes vertentes da localização acústica, que são os métodos baseados na estimação dos
retardos temporais (TDE) e os baseados na energia acústica (EBL). Suas características
e limitações foram exploradas, bem como os principais métodos existentes e o estado da
arte. Por �m, foram mostrados os métodos adotados neste trabalho para um maior apro-
fundamento e comparação com as propostas de métodos de localização de fonte, abordadas
nos Capítulos 3 e 4.
33
3 LOCALIZAÇÃO DE FONTES BASEADA NO RETARDO TEMPORAL
A localização de fontes de sinais acústicos utilizando a estimação dos atrasos temporais
é vastamente explorada na literatura. O uso do algoritmo PHAT (KNAPP, 1976) como
estimador destes retardos temporais apresenta bom desempenho em ambientes fechados
e é, portanto, incorporado às diferentes soluções de localização. Entretanto, o método
PHAT e suas vertentes, possuem uma limitação em sua formulação, pois considera que o
ruído e o sinal da fonte são descorrelatados entre si, ou seja, o ruído aditivo que distorce
os sensores é representado por um ruído gaussiano branco. Além disto, o ruído aditivo
do método PHAT é considerado como estacionário. Diversos estudos na literatura evi-
denciam que ruídos acústicos reais apresentam distribuição de amplitudes não-gaussianas
(WEBSTER, 1993), (MING, 2007), (ZÃO, 2012) e espectros coloridos. Somado a isto,
devido ao fato de que os sinais e ruídos são originados pelos mais variados tipos de fontes
acústicas, como, por exemplo, aviões, pessoas falando, música e veículos, possuem dis-
tintas características espectrais e temporais, sendo não-estacionários e não-gaussianos. A
correlação entre os ruídos e as fontes acústicas a serem localizadas, pode afetar o desem-
penho da estimação real da posição espacial ou geográ�ca destas fontes. Surge então a
necessidade de uma nova solução, que permita uma melhor localização mais apropriada
para ambientes onde a fonte de sinais é corrompida por ruídos acústicos reais.
Este Capítulo apresenta uma proposta de um método de localização de fontes de sinais
acústicos quando as mesmas são corrompidas por ruídos acústicos não-estacionários e cuja
correlação entre fonte de sinal e ruído é explorada na solução.
3.1 MÉTODO DE LOCALIZAÇÃO ACÚSTICA SRP-PHAT
A localização acústica baseada em atraso temporal é geralmente realizada em duas
etapas: estimação de retardos e localização propriamente dita. A estimação dos retardos
é realizada pelo processamento dos sinais recebidos de pares de sensores acústicos ou
conjunto de microfones. Já a localização, emprega estes retardos estimados para indicar
a posição provável da fonte acústica que emitiu os sinais (BRANDSTEIN, 1997). A
estimação dos retardos temporais baseada no método PHAT em conjunto com o método
34
de localização SRP são o estado da arte por apresentarem as melhores taxas de acerto,
considerando a descorrelação entre fontes e ruídos. O método de localização SRP-PHAT
(DIBIASE, 2001), (MORAGUES, 2008) baseia-se no processamento dos sinais recebidos
por sensores localizados em posições geográ�cas distintas e �xas. Com os valores dos
retardos estimados com o uso do algoritmo PHAT, estima-se a posição da fonte acústica
geradora dos sinais recebidos por meio de um localizador, denominado SRP.
3.1.1 ESTIMADOR DE RETARDO TEMPORAL PHAT
Apesar do método PHAT ter sido proposto originalmente para ambientes fechados,
ou seja, onde há reverberação, este trabalho avalia o seu emprego para situações onde as
fontes de sinais se encontram em um ambiente aberto (POURMOHAMMAD, 2013).
Considere um campo aberto, onde uma fonte emissora de sinal acústico é recebida,
amostrada e discretizada por dois sensores localizados em duas posições distintas,
x1(n) = s(n) + w1(n) (3.1)
x2(n) = s(n+ τ) + w2(n), (3.2)
onde x1(n) e x2(n) são os sinais recebidos nos sensores 1 e 2, respectivamente, s(n) é sinal
gerado pela fonte acústica, w1(n) e w2(n) são ruídos assumidos como estacionários, com
média zero e descorrelatados entre si e com o sinal s(n), e τ o retardo percebido devido
ao tempo necessário que o som leva para percorrer a distância entre a fonte e o centro do
segmento de reta que une os dois sensores.
Uma maneira usual de se determinar o retardo temporal τ é através da função de
correlação cruzada
Rx1x2(τ) =∞∑
n=−∞
x1(n)x2(n+ τ), (3.3)
sendo que o valor de τ que maximiza a EQ. 3.3 fornece uma estimação do retardo temporal
real, ou seja
τ = argmaxτ
Rx1x2(τ). (3.4)
A correlação cruzada entre dois sinais, no domínio da frequência, pode ser obtida
utilizando-se a convolução dos sinais resultantes da transformada de Fourier, de�nida por
F
{∞∑
n=−∞
x1(n)x2(n− τ)
}= X1(k)X∗2 (k), (3.5)
35
onde F{.} denota a transformada de Fourier, X1(k) eX2(k) representam as transformadas
de Fourier dos sinais x1(n) e x2(n), e ∗ denota o complexo conjugado. Isto signi�ca que
a função de correlação cruzada de dois sinais pode ser determinada aplicando-se a trans-
formada de Fourier inversa ao produto da transformada dos dois sinais. Considerando-se
esta propriedade, e aplicando-se na EQ. 3.1, obtém-se a correlação cruzada no domínio
da frequência (CX1X2(k)), também denominada de espectro cruzado,
CX1X2(k) = E[X1(k)X∗2 (k)]
CX1X2(k) = E[|S(k)|2ejωkτ ] + E[W1(k)W ∗2 (k)]
+E[S(k)W ∗2 (k)] + E[S∗(k)W1(k)ejωkτ ], (3.6)
onde E[.] representa o operador esperança ou expectância,W1(k),W2(k) as transformadas
de Fourier de um ruído gaussiano branco aditivo nos sensores 1 e 2 e S(k) a transformada
do sinal. Como no método PHAT assumiu-se os ruídos descorrelatados entre si e o sinal
de interesse, as três últimas parcelas da EQ. (3.6) são iguais a zero. Logo, a correlação
cruzada no domínio da frequência dos sinais x1(n) e x2(n) é a dada por,
CX1X2(k) = E[|S(k)|2ejωkτ ]. (3.7)
Segundo a propriedade citada na EQ. 3.5, é possível determinar a função de correlação
cruzada dos sinais recebidos pelos sensores calculando-se a transformada inversa do seu
espectro cruzado. Porém, para a obtenção da função CX1X2 no domínio do tempo, é
possível aplicar-se uma �ltragem nas componentes de frequência do espectro cruzado.
Esta ideia foi proposta em (KNAPP, 1976) e �cou conhecida como correlação cruzada
generalizada (GCC - Generalized Cross-Correlation Function),
RGCC(τ) = F−1 {G(k)CX1X2(k)} , (3.8)
onde RGCC(τ) é a função de correlação cruzada generalizada e G(k) representa uma
função de ponderação na frequência. Nota-se que para G(k) = 1, a função GCC é reduzida
à função de correlação cruzada habitual. Diversas propostas para a função G(k) foram
propostas na literatura, dentre eles, o processador de Roth (ROTH, 1971), a transformada
de coerência suavizada (SCOT - Smoothed Coherence Transform) (CARTER, 1973), o
�ltro de Eckart (ECKART, 1952) e a �ltragem PHAT (KNAPP, 1976). Em (KNAPP,
1976) foi mostrado que dentre todas as funções propostas, PHAT é a única que consegue
reduzir os efeitos da reverberação na função de correlação cruzada, permitindo um maior
36
isolamento do valor de máximo da função GCC, causando erros na estimação do retardo.
A função PHAT é de�nida por
G(k) =1
|CX1X2(k)|, (3.9)
que incorporada na EQ. 3.8, resulta na função GCC-PHAT,
RGCC(τ) = F−1{CX1X2(k)
|CX1X2(k)|
}, (3.10)
empregada para estimar-se retardos temporais através de,
τ = argmaxτ
RGCC(τ). (3.11)
3.1.2 LOCALIZADOR DE FONTES ACÚSTICAS BASEADO NO SRP
O método de localização SRP (OMOLOGO, 1997) consiste em uma técnica de con-
formação de feixe (beamforming) que utiliza a informação da disposição geométrica de
um conjunto de microfones para determinar a posição espacial de uma fonte. Isto é feito
através da análise dos valores de uma função espacial3 gerada pela composição dos sinais
recebidos pelos diferentes pares de sensores. De forma geral, a função SRP é de�nida por
P (r) =M∑i=0
[τi − τi(r)], (3.12)
onde r é um vetor de posição em coordenadas cartesianas da fonte do sinal,M é o número
de pares de sensores utilizados, τi é o retardo temporal estimado entre o par de sensores
i (i = 1, 2, ...,M) e τi(r) indica o retardo temporal teórico no par de sensores i quando a
fonte está posicionada na posição r.
Em (DIBIASE, 2001), o autor mostrou que a função SRP pode ser reescrita em termos
da função de GCC da seguinte forma,
P (r) = 2π
Q∑q=1
Rq(τq(r)), (3.13)
onde Q é a quantidade de pares de sensores formados da combinação dois a dois de N
sensores sem repetição4, Rq é a função GCC do par de sensores q (q = 1, 2, ...Q), e τq é
o retardo temporal teórico que seria observado pelo par de sensores q se a fonte estivesse
3Função escalar (f : R3 → R) onde as variáveis são as coordenadas cartesianas x, y, z.4Com um conjunto de N sensores é possível formar N(N − 1)/2 pares de sensores diferentes.
37
(a) (b) (c)
FIG. 3.1: Lugar geométrico dos pontos com mesmo valor da função SRP de um ponto que passe pelaposição da fonte gerada para uma fonte única e dois sensores. (a)Hiperboloide em 3D; (b)Hiperboloideem 3D cortado por um plano; (c)Hipérbole em 2D resultante do corte. Figura extraída de (VELASCO,2012).
na posição r. O localizador SRP foi proposto para uso em conjunto com o estimador
PHAT, sendo por isto, o método batizado como SRP-PHAT. Deste modo, de acordo com
o SRP-PHAT, a posição da fonte de sinal é obtida por,
r = argmaxr
Q∑q=1
Rq(τq(r)), (3.14)
cuja posição geográ�ca da fonte de sinais é estimada pelo argumento da função SRP-
PHAT onde o seu valor é máximo. A busca deste valor pode acarretar em complexidade
computacional elevada, se esta for realizada em grandes regiões de busca e se for desejada
elevada precisão. Muitos métodos foram propostos na literatura com objetivo de reduzir
o custo computacional desta busca (DO, 2007), (PETERSON, 2005).
Uma interpretação geométrica da função SRP-PHAT é apresentada em (VELASCO,
2012), que diz que para um par de sensores que recebe o sinal da fonte acústica, o lugar
geométrico dos pontos do espaço que possuem o mesmo valor da função SRP-PHAT,
ou seja, as possíveis posições da fonte de sinal, é delimitado por uma das folhas de um
hiperboloide de revolução5, cujos focos6 estão localizados nas posições espaciais de cada
um dos sensores. Isto signi�ca que, a localização de uma fonte por meio de um único
par de sensores terá in�nitas soluções. Tal situação pode ser visualizada na FIG. 3.1(a),
onde é ilustrada a posição da fonte (em vermelho) e a folha do hiperboloide que passa
pela posição da fonte, em verde, indicando todas as possíveis posições da fonte de sinal.
Se a localização foi realizada em um plano (2D), o lugar geométrico de pontos de mesmo
5Sejam a, b e c, reais e positivos, denomina-se hiperboloide de duas folhas a superfície formada pelo
conjunto de pontos P = (x, y, z), cujas coordenadas satisfazem uma equação do tipo x2/a2 − y2/b2 −z2/c2 = 1. A superfície gerada possui duas regiões distintas, e cada uma delas é denominada folha.
6Pontos considerados como referência de valores simétricos em relação aos pontos de uma curva dada.
38
(a) (b) (c)
FIG. 3.2: Lugar geométrico dos pontos com mesmo valor da função SRP de um ponto que passe pelaposição da fonte gerada para uma fonte única e dois pares de sensores independentes. (a)Hiperboloideem 3D; (b)Hiperboloide em 3D cortado por um plano; (c)Hipérbole em 2D resultante do corte. Figuraextraída de (VELASCO, 2012).
valor de SRP é reduzido a uma parábola (FIGS. 3.1(b) e 3.1(c)). Como existem in�nitas
posições para a fonte de sinal, percebe-se que a localização da fonte torna-se inviável com
apenas um par de sensores. A FIG. 3.2(a) mostra o mesmo lugar geométrico gerado agora
por dois pares de sensores distintos. Perceba que, no caso em três dimensões, a interseção
das duas folhas dos hiperboloides formam conjuntos de in�nitos pontos, não sendo ainda
possível uma solução única para a posição da fonte de sinal. Porém, considerando a
localização em duas dimensões (FIGS. 3.2(b) e 3.2(c)), as parábolas se interceptam em
um único ponto, indicando que para este caso, dois pares de sensores permitem uma
localização única pelo método SRP.
Um exemplo de função SRP em 2D é ilustrado na FIG. 3.3, onde uma fonte de sinais
é posicionada no ponto de coordenadas (2,6 ; 2,6), dentro de um plano quadrado de 5
metros de lado. O sinal da fonte é recebido por 3 sensores que se encontram dentro do
mesmo quadrado, em posições distintas. O valor de máximo da função indica a posição
espacial estimada da fonte do sinal acústico.
3.2 PROPOSTA DE LOCALIZAÇÃO DE FONTES ACÚSTICAS - MÉTODO SRP-H-
PHAT
Este trabalho propõe um novo método de localização de fontes acústicas baseado no
método SRP-PHAT. O principal objetivo é tornar a localização das fontes acústicas mais
robusta incluindo os efeitos da distorção dos ruídos reais na representação teórica.
A ideia do método proposto é incluir o grau de correlação temporal entre sinais e
ruídos, caracterizada pelo expoente de Hurst (0 ≤ H ≤ 1). Além disso, é proposta a
representação através de um fGn. Deste modo, com uma melhor representação do ruído
39
FIG. 3.3: Representação de uma função SRP gerada da leitura de 3 sensores durante a localização dosinal, cuja fonte geradora está localizada na posição (2,6 ; 2,6).
e sua correlação com o sinal, espera-se obter resultados de localização mais próximos aos
reais, do que o método SRP-PHAT, que considera a descorrelação entre o sinal e o ruído.
Os principais conceitos e de�nições envolvidas na proposta SRP-H-PHAT são abordadas
na sequência desta Seção.
3.2.1 EXPOENTE DE HURST
Seja o sinal acústico representado por um processo estocástico s(t), com função de
autocorrelação normalizada de�nida por
ρ(k) =E{([s(t)− µs])(s(t+ k)− µs}
σ2x
, (3.15)
onde µs e σ2s são a média e variância de s(t), respectivamente. O expoente de Hurst
(0 ≤ H ≤ 1) é de�nido pela taxa de decaimento de ρ(k), que possui comportamento
assintótico dado por
ρ(k) ≈ H(2H − 1)k2H−1, quando k →∞. (3.16)
O valor de H está diretamente relacionado com as características espectrais de s(t).
Conforme demostrado em (MANDELBROT, 1968), a densidade espectral de potência
(Ss(f)) de s(t), de�nida pela transformada de Fourier de ρ(k) é proporcional a f 1−2H
quando f → 0, ou seja,
Ss(f) = F{ρ(k)} ∝ f 1−2H , f → 0. (3.17)
40
Isto signi�ca que para valores H < 1/2, s(t) é predominantemente composto por altas
frequências. Para o caso H = 1/2, Ss(f) é aproximadamente constante ao longo de todo o
espectro de frequências (ruído branco). Já para os valores de H ∈ (1/2, 1], a maior parte
da energia de s(t) está concentrada nas baixas frequências.
3.2.2 ESTIMAÇÃO DO EXPOENTE DE HURST
Nesta Dissertação, para a estimação do expoente H foi adotado o método baseado em
wavelets (VEITCH, 1998). Este pode ser resumido em três passos:
a) Decomposição com wavelets: a transformada wavelet discreta (DWT - discrete
wavelet transform) é aplicada para decompor sucessivamente o sinal de entrada
em coe�cientes de detalhes (d(j, n)) e aproximação (a(j, n)), onde j representa as
escalas da decomposição (j = 1, 2, ...J) e n o índice de cada escala.
b) Estimação da Variância: para cada escala j, a variância σ2j = (1/Nj)
∑n d(j, n)2 é
calculada dos coe�cientes de detalhes, onde Nj é o número de coe�cientes disponíveis
para cada escala j. Em (VEITCH, 1998) foi demostrado que E[σ2j ] = CHj
2H−1, onde
CH é uma constante.
c) Estimação de H: uma regressão linear ponderada é empregada para obter a incli-
nação θ de xj = log2(σ2j ) versus j. Finalmente, o expoente de Hurst é estimado
por
H =(θ + 1)
2. (3.18)
Os coe�cientes de aproximação e detalhe são obtidos através de �ltros digitais especial-
mente projetados e propostos em (DAUBECHIES, 1992). Para a estimação foram imple-
mentados três diferentes �ltros de Daubechies, enunciados neste trabalho como DAUB4
(4 escalas), DAUB6 (6 escalas) e DAUB12 (12 escalas). Para este trabalho foi utilizado
o �ltro DAUB12, pois foi o que apresentou melhor precisão na estimação dos valores de
H. O estimador wavelets permite um ajuste �no da estimação limitando-se o intervalo
de coe�cientes de detalhes utilizados para a regressão linear, e portanto na estimação de
H. Um exemplo de esquema de decomposição do método wavelets é ilustrado na FIG.
3.4, que considera J = 3 escalas de decomposição. A FIG. 3.5 apresenta a etapa �nal da
estimação de H de três sinais com valores de de H iguais a 0,2, 0,5 e 0,8, respectivamente.
41
2
2 2
2
2
2d (2, )n
d (3, )n
d (1, )n
(2, )na
σ22
σ12
σ32
2
Passa−Banda
FiltroPassa−Baixa
(3, )n
(1, )na
a
Filtro
Filtro
Filtro
Passa−Banda
Passa−BaixaFiltro
Filtro
Passa−Banda
Passa−Baixa
= Decimador
= Estimador de Variância
σ2
σ2
σ2
σ2
FIG. 3.4: Decomposição de um sinal pela transformada wavelets discreta em 3 escalas.
(a) (b) (c)
FIG. 3.5: Etapa �nal do processo de estimação (regressão linear) de H de 3 sinais arti�ciais. Os valoresverdadeiros de H de cada sinal são (a)H = 0, 2, (b)H = 0, 5 e (c)H = 0, 8.
Nota-se que a regressão linear fornece o valor da inclinação θ, diretamente relacionado
com o expoente de Hurst, conforme EQ. 3.18.
3.2.3 RUÍDO FRACIONÁRIO GAUSSIANO
Um ruído fracionário gaussiano (fGn - fractional Gaussian noise) (MANDELBROT,
1968) é uma sequência de variáveis aleatórias gaussianas X1, X2, X3, ... com a seguinte
propriedade
AN =X1 +X2 +X3 + ...+XN
NH
d=X, (3.19)
onde d= representa semelhança de distribuição de probabilidade. De forma análoga, pode
ser dada em termos da variância amostral, var(XN) = NH−1var(X1), onde
var(XN) =var(X1 +X2 +X3 + ...+XN)
NE[X1](3.20)
Perceba que quando H = 1/2, as variáveis aleatórias Xi são necessariamente indepen-
dentes. A função de autocorrelação de um fGn é dada por
E[X0Xk] = RH(k) =1
2[(k − 1)2H − 2k2H + (k + 1)2H ], (3.21)
onde k é o intervalo (lag) da função de autocorrelação, H é o expoente de Hurst. Para
todos os valores de H, pode-se aproximar a densidade espectral de um fGn por SH(f) ∼Cσ2|f |1−2H , quando |f | → 0. Para o caso particular em que H = 1/2, o fGn se reduz a
um ruído branco gaussiano.
42
O processo estocástico fGn foi adotado nesta proposta para representar a correlação
existente entre o sinal da fonte a ser localizada com o ruído real que distorce os sensores.
3.2.4 ESTIMADOR DE RETARDO TEMPORAL H-PHAT
A correlação no domínio da frequência entre entre dois sinais recebidos por sensores
localizados em diferentes posições é de�nida por,
CX1X2(k) = E[X1(k)X∗2 (k)]
CX1X2(k) = E[|S(k)|2ejωkτ ] + E[W1(k)W ∗2 (k)]
+E[S(k)W ∗2 (k)] + E[S∗(k)W1(k)ejωkτ ]. (3.22)
Na técnica PHAT, a correlação entre sinal e ruído é desprezada, fazendo com que
os três últimos termos da EQ. 3.22 sejam anulados. De acordo com o método proposto
neste trabalho, tais termos não mais serão nulos, pois a correlação entre sinal e ruído será
levada em consideração. Deste modo, as parcelas relacionadas à correlação entre sinal e
ruído serão representadas por um processo fracionário gaussiano, cujo parâmetro H será
dado pelo valor do expoente de Hurst estimado do sinal recebido (sinal + ruído) em cada
sensor. O valor dos parâmetros média e variância são obtidos destes sinais.
Na proposta, o expoente de Hurst é incluído na expressão da função de correlação
cruzada. Assim, a função de correlação é representada por
CX1X2(k) = E[Xα1 (k)Xβ
2 (k)], (3.23)
onde α e β estão relacionados com o expoente de Hurst segundo
H =α + β
2, (3.24)
onde α e β representam os valores de Hurst de cada sinal recebido nos sensores 1 e 2,
respectivamente. Como o sinal recebido em cada sensor é uma versão defasada do sinal
original, é razoável considerar que α = β = H, logo, pode-se utilizar o valor deH estimado
do sinal recebido para calcular a correlação cruzada e assim, estimar-se o retardo temporal.
O método proposto então é realizado da seguinte forma: um fGn é gerado e empregado
para distorcer o sinal da fonte, representado assim, a correlação existente entre sinal e
ruído. Após isto, a função H-PHAT (EQ. 3.23) é utilizada para determinar os retardos
temporais dos sinais recebidos nos pares de sensores.
43
A principal contribuição do método proposto é permitir estimar retardos temporais
entre sinais recebidos por pares de sensores considerando a correlação entre sinal e ruído.
Além disso, estes retardos são utilizados em conjunto com o método de localização SRP
formando o método de localização denominado SRP-H-PHAT. Convém observar que,
embora para este trabalho o método de localização SRP tenha sido escolhido, o estimador
H-PHAT pode ser utilizado por qualquer outro método de localização. O uso do estimador
H-PHAT pode ser também adequado para a estimação de retardos quando as distorções
são não-estacionárias.
3.2.5 ÍNDICE DE NÃO-ESTACIONARIEDADE (INS)
O índice de não-estacionariedade (INS - index of nonstationarity) é um método tempo-
frequência proposto em (BORGNAT, 2010) para determinar, de forma objetiva, o grau
de não-estacionariedade de sinais e ruídos.
Considere um sinal de entrada x(t). O primeiro passo para o cálculo do INS é a
construção de referenciais estacionários (surrogates) de x(t). Para isto, aplica-se a trans-
formada discreta de Fourier (DFT - discrete Fourier transform) sobre x(t) e substitui-se
a fase do sinal original por uma sequência aleatória com amostras independentes e uni-
formemente distribuídas no intervalo [−π, π]. Uma versão �estacionária" de x(t) é gerada
pela transformada inversa de Fourier da sequência obtida.
O passo seguinte é comparar o sinal analisado com os seus referenciais estacionários.
Para isto, utiliza-se a distância de Kullback-Leibler (DKL) simétrica (BASSEVILLE,
1989), que compara os espectrogramas do sinal x(t) com os obtidos dos diversos refe-
renciais substitutos.
Finalmente, o índice de não-estacionariedade é de�nido como a razão entre a variância
das distâncias observadas (Θ0(j)) do sinal em análise e a média das variâncias obtidas
dos sinais referenciais (Θ1). Ou seja,
INS :=
√Θ1
〈Θ0(j)〉j. (3.25)
Para o teste de não-estacionariedade do sinal em análise, os autores de�niram um
limiar γ considerando um valor de precisão de 95%. Desta forma, o sinal é considerado
não-estacionário se o valor de INS estiver acima deste limiar. Ou seja,
INS
{≤ γ , x(t) é estacionário;
> γ , x(t) não é estacionário.(3.26)
44
3.3 RESULTADOS DE LOCALIZAÇÃO ACÚSTICA
O objetivo desta Seção é mostrar através de testes e simulações o desempenho do
método SRP-PHAT na localização de fontes na presença de fontes de ruídos reais, ou
seja, o ruído aditivo deixa de ser considerado como descorrelatado. Além disto, pretende-
se veri�car que o método proposto possibilita obter-se resultados mais próximos aos reais
se comparado com o SRP-PHAT.
3.3.1 CENÁRIO DOS EXPERIMENTOS
Diversos experimentos foram elaborados para este trabalho. Os algoritmos de localiza-
ção de fontes foram implementados utilizando linguagem C/C++. Para os testes, foram
selecionados 6 sinais e 6 ruídos acústicos reais obtidos de distintas bases, dentre elas a
base de voz TIMIT (GAROFOLO, 1993), além das bases NOISEX-927 (VARGA, 1993) e
FreeSfx8. Da base TIMIT foi escolhida uma locução feminina, para representar uma das
fontes de sinal, referida neste trabalho, como Voz. As fontes de sinais Helicóptero e Mo-
toserra foram selecionadas da base FreeSfx. O ruído acústico Assovio, obtido da mesma
base. Da base NOISEX, foram extraídas as fontes Avião, Metralhadora e Balbúrdia, em-
pregadas como fontes de sinais, enquanto que o Veículo Militar, Navio, F16 e Carro foram
utilizados como ruídos. A Balbúrdia também foi utilizada tanto como fonte de sinal como
de ruído. Todos os sinais foram reamostrados para 16 kHz e �cortados" para que tivessem
a mesma duração, de aproximadamente 30 segundos. Para isto, foi utilizado o aplicativo
�Audacity", utilizado para processamento dos sinais. Uma breve descrição de cada um
destes sinais e ruídos bem como a sua forma de emprego neste trabalho, está apresentada
na TAB. 3.1.
Para a estimação dos valores de INS, adotou-se a distância de Kullback-Leibler e 50
referenciais substitutos (surrogates) foram empregados nos experimentos. A janela mínima
escolhida (Th/T ) é a correspondente a 1024 amostras, ou seja, considerando que esta é a
menor quantidade de amostras empregadas no trabalho, o índice de não-estacionaridade
pode ser observado na mesma situação da realizada nos experimentos de localização.
O expoente de Hurst foi estimado utilizando o método wavelets, com o �ltro DAUB12
e os coe�cientes de escala adotados estão descritos na TAB. 3.2.
7Base disponível publicamente em http://www.speech.cs.cmu.edu/comp.speech/section1/data/noisex.html.8Base disponível publicamente em http://www.freesfx.co.uk/.
45
TAB. 3.1: Descrição e forma de emprego dos sinais e ruídos selecionados para o trabalho.
Nome Descrição Emprego
Voz Uma mulher falando (em inglês) em tom de conversação fonteHelicóptero Som externo de um helicóptero se deslocando fonteMotoserra Operação de uma motoserra fonteAvião Cockpit de um avião Buccaneer se deslocando a 190 nós fonteMetralhadora Metralhadora de calibre .50 realizando disparos fonteBalbúrdia 100 pessoas conversando em uma sala fonte
Veículo Militar Veículo militar Leopard se deslocando ruídoAssovio Pessoa assoviando uma música ruídoNavio Sala de operações de um navio Destroyer ruídoMíssil Míssil sobrevoando uma área ruídoF16 Cockpit de um Caça F16 a 500 nós ruídoCarro Veículo Volvo 340, a 120 km/h, em condições chuvosas ruído
TAB. 3.2: Estimação de H: Filtros e escalas utilizados no estimador wavelets para cada sinal e ruído.
Sinal Filtro e escalas
Voz DAUB12(3,10)Helicóptero DAUB12(5,7)Motoserra DAUB12(5,9)Avião DAUB12(5,10)Metralhadora DAUB12(5,10)Balbúrdia DAUB12(4,8)
Ruído Filtro e escalas
V. Militar DAUB12(5,10)Assovio DAUB12(6,9)Navio DAUB12(5,11)Míssil DAUB12(3,11)F16 DAUB12(5,10)Carro DAUB12(9,10)
Nos experimentos de localização de fonte foi adotado um plano quadrado de 10 x 10
metros. As fontes de sinais foram posicionadas de forma aleatória dentro do quadrado
e permaneceram imóveis durante a simulação. Também no mesmo plano, e em posições
aleatórias, foram posicionados três sensores, considerados ideais9, com mesmo ganho e
com recepção omnidirecional. A atenuação do sinal devido à distância propagada foi
desprezada na análise. O ruído aditivo utilizado foi inserido em cada um dos sensores,
com valores de SNR variando entre 0 dB e 15 dB, com incrementos de 5 dB. A localização
foi realizada para quadros, sem sobreposição, para os tamanhos de 1024, 2048 e 4096
amostras. Logo, para a frequência de amostragem adotada (16 kHz), a duração do menor
quadro corresponde a aproximadamente 64 ms.
A função SRP foi estimada por varredura de cada um dos pontos do plano quadrado,
espaçados em 2,14 cm, ou seja, dentro do cenário empregado, para cada localização,
aproximadamente 217 mil pontos são veri�cados durante a análise. Os retardos temporais
entre a fonte acústica e cada par de sensores são calculados considerando a velocidade do
9Um sensor é considerado ideal quando recebe o sinal com a mesma intensidade independente da
direção que o sinal é recebido.
46
som igual a 343 metros por segundo. Para cada quadro do sinal recebido, é realizada uma
estimação da posição da fonte. Neste trabalho, se a distância entre a posição estimada
e a real posição da fonte for menor do que 13 centímetros, é considerado um acerto
na estimação da posição. Este critério foi utilizado para todos os quadros e assim, é
determinada a taxa de acertos de localização, de�nida como a razão entre número de
quadros com estimação da posição correta e o número total de quadros do sinal.
Para a avaliação do método proposto, SRP-H-PHAT, a correlação entre sinal e ruído
proposta e caracterizada por um fGn, é gerada pelo método do deslocamento de ponto
médio (midpoint displacement) (BARNSLEY, 1988). Já a descorrelação entre sinal e ruído
é representado pelo ruído gaussiano branco, gerado pelo método de Box-Muller (BOX,
1958).
A TAB. 3.3 ilustra a acurácia dos resultados dos experimentos de localização para cada
valor dos quadros adotados, segundo a desigualdade de Chebyshev (PAPOULIS, 2002),
para um grau de con�ança de 95%. Para o sinal completo (30 segundos), o valor obtido
é de 0,0013, e representa a acurácia das estimações do expoente de Hurst e do INS.
TAB. 3.3: Acurácia da localização com grau de con�ança de 95%
Número de Amostras Acurácia
1024 0,0302048 0,0214096 0,015
3.3.2 ESTIMAÇÃO DO INS
Neste trabalho, investiga-se o índice de não estacionaridade dos sinais e ruídos. Estes
são classi�cados, quanto ao seu INS em três grupos: estacionários, não-estacionários e
altamente não-estacionários. Se o sinal ou ruído possui valor de INS acima do limiar de
estacionaridade, este é considerado como não-estacionário. No estudo é considerado como
altamente não-estacionário, o sinal ou ruído que apresentar valores de INS maiores que
100 vezes o seu limiar de estacionaridade. Se os valores de INS estiverem abaixo do limiar
para a maioria das janelas de análise, o sinal ou ruído é considerado como estacionário.
A FIG. 3.6 mostra o resultado da estimação do INS para os seis sinais seleciona-
dos. A primeira linha mostra, da esquerda para a direita, as fontes Avião e Balbúrdia,
sendo o primeiro classi�cado como estacionário e o segundo como não-estacionário. A
47
(a) (b)
(c) (d)
(e) (f)
FIG. 3.6: Resultado da estimação dos valores de INS dos sinais acústicos reais, (a)Avião, (b)Balbúrdia,(c)Motoserra, (d)Helicóptero, (e)Voz e (f)Metralhadora. A linha em vermelho representa os valores deINS e o tracejado em verde, os valores de limiar de estacionaridade.
linha do meio apresenta duas fontes não-estacionárias, respectivamente, Helicóptero e
Motoserra. A linha inferior ilustra as fontes Voz e Metralhadora, classi�cadas como al-
tamente não-estacionárias. Perceba que, embora Balbúrdia e Metralhadora sejam sinais
não-estacionários, enquanto o primeiro apresenta INS máximo próximo a 30 vezes o limiar,
o segundo apresenta valores da ordem de 800 vezes o seu limiar de estacionaridade.
O resultado da estimação dos valores de INS dos ruídos acústicos é apresentado na
FIG. 3.7. O mesmo critério de classi�cação adotado para as fontes foi aplicado para
classi�car os ruídos em grupos. Da FIG. 3.7, pode-se concluir que os ruídos Carro e Navio
se enquadram no grupo dos ruídos estacionários, pois os valores de INS estão abaixo
do limiar para todos os valores de Th/T . No entanto, percebe-se que os ruídos Veículo
Militar e F16, são não-estacionários. Ao grupo dos altamente não-estacionários pertencem
os ruídos Míssil e Assovio.
Os espectrogramas dos sinais e ruídos são mostrado na FIG. 3.8, onde é possível ve-
ri�car a variação do espectro de frequência ao longo do tempo de cada sinal ou ruído.
Perceba que os sinais e ruídos, cujos espectrogramas apresentam maior variação do espec-
tro são os que possuem maiores valores de INS, se enquadrando portanto, no grupo dos
48
(a) (b)
(c) (d)
(e) (f)
FIG. 3.7: Resultado da estimação dos valores de INS dos ruídos acústicos reais, (a)Carro, (b)Navio,(c)Veículo Militar, (d)F16, (e)Míssil e (f)Assovio. A linha em vermelho representa os valores de INS e otracejado em verde, os valores de limiar de estacionaridade.
não-estacionários e altamente não-estacionários. A fonte avião possui um espectrograma
constante ao longo do tempo, indicando sua estacionaridade, que pode ser veri�cada tam-
bém pelos valores de INS obtidos.
3.3.3 ESTIMAÇÃO DO EXPOENTE DE HURST
O resultado da estimação do expoente de Hurst é apresentado na TAB. 3.4. Para
facilitar a visualização, os resultados estão ordenados por ordem crescente de H.
TAB. 3.4: Valores do expoente de Hurst estimado de cada sinal e ruído acústico, em ordem crescente deH.
Sinal H
Voz 0,10Helicóptero 0,10Motoserra 0,24Avião 0,29Metralhadora 0,45
Balbúrdia 0,58
Ruído H
Assovio 0,14Veículo Militar 0,22Navio 0,41
Míssil 0,52
F16 0,67Carro 0,84
Observa-se que tanto os sinais quanto os ruídos acústicos reais selecionados neste
49
(a) Avião (b) Balbúrdia
(c) Helicóptero (d) Motoserra
(e) Voz (f) Metralhadora
(g) Carro (h) Navio
(i) Veículo Militar (j) F16
(k) Assovio (l) Míssil
FIG. 3.8: Espectrogramas dos sinais e ruídos acústicos.
trabalho possuem valores de H bem distintos e dentro da faixa entre 0,10 e 0,84, isto
indica que praticamente toda a faixa de valores de Hurst é abrangida pelos sinais de
áudio. O sinal Voz possui um valor de H muito pequeno, o que indica que o sinal é de
alta frequência. O sinal Balbúrdia apresenta um valor de H = 0, 58 , o que indica que a
mistura de sinais de voz é uma fonte de sinal de baixa frequência, ou seja, altera a faixa de
frequência original da voz. Os demais sinais possuem um valor de H < 1/2, o que mostra
50
(a) (b)
FIG. 3.9: Estimação do expoente de Hurst para as fontes (a)Avião e (b)Metralhadora, considerandoquadros de 1024, 2048 e 4096 amostras.
que os sinais acústicos selecionados não em sua maioria de alta frequência, com correlação
negativa ou anti-persistente entre as amostras. Dentre os ruídos, o Míssil possui valor
de H que corresponde a um sinal sem correlação entre as amostras, próxima a um ruído
gaussiano branco. Assovio, Veículo Militar e Navio são ruídos de alta frequência, com
H < 1/2 e no grupo dos ruídos de baixa frequência, estão o F16 e o Carro (H > 1/2).
A estimação do expoente de Hurst dos sinais e ruídos foi realizada quadro a quadro,
ao longo da duração completa (30 segundos) dos sinais e ruídos. Considerou-se o valor
de H para os três tamanhos de quadros empregados neste trabalho (1024, 2048 e 4096
amostras). Os valores de H obtidos para as fontes Avião e da Metralhadora são ilustrados
na FIG. 3.9. Percebe-se que o valor de H varia com o tempo para ambos os sinais.
Para o sinal Metralhadora (FIG. 3.9(f)), que é altamente não-estacionário, a variação do
expoente de Hurst é muito maior que a observada para o Avião (FIG. 3.9(a)), que é uma
fonte de sinal estacionário.
Finalmente, levando em consideração que a localização de fontes acústicas é realizada
com o sinal da fonte corrompido com o ruído, deve-se estimar também os valores de
H destes sinais acústicos corrompidos para os diferentes valores de SNR. A TAB. 3.5
apresenta o resultado da estimação dos valores de H. Perceba que dentre os ruídos
selecionados para este teste, (vide a TAB. 3.4), Veículo Militar possui um valor de H
= 0,22, indicando que o ruído é de alta-frequência, o ruído Carro é caracterizado como
de baixa-frequência pois seu valor de H foi estimado em 0,84. O ruído Míssil teve o
parâmetro de Hurst estimado em 0,52, indicando que o mesmo possui um comportamento
muito próximo a de um ruído branco ou descorrelatado.
Também é possível notar que os valores de H da fonte são afetados pelos ruídos,
principalmente para os valores menores de SNR, e sofrendo menor in�uência para elevadas
SNR, onde predomina o H do sinal sem distorção. Este resultado é interessante pois
51
mostra que a correlação entre sinal da fonte e o ruído depende não só do tipo de ruído
que distorce o sinal mas também da intensidade deste ruído.
TAB. 3.5: Estimação de H do sinal corrompido por ruído aditivo.
Fonte H do sinal SNRV. Militar Míssil Carro(H = 0,22) (H = 0,52) (H = 0,84)
H (sinal + ruído)
Balbúrdia 0,58
0dB 0,45 0,46 0,755dB 0,50 0,49 0,6910dB 0,51 0,51 0,6115dB 0,52 0,53 0,55
Avião 0,29
0dB 0,27 0,39 0,765dB 0,26 0,35 0,6910dB 0,26 0,29 0,6015dB 0,26 0,27 0,48
Motoserra 0,24
0dB 0,28 0,37 0,755dB 0,30 0,36 0,7110dB 0,33 0,34 0,6415dB 0,34 0,36 0,56
Voz 0,10
0dB 0,21 0,21 0,835dB 0,18 0,16 0,8010dB 0,16 0,14 0,7515dB 0,13 0,12 0,67
3.3.4 RESULTADO DA LOCALIZAÇÃO DO SRP-PHAT COM RUÍDOS REAIS E
RUÍDO DESCORRELATADO
O objetivo deste experimento é veri�car o impacto da correlação entre as fontes de
sinais e ruídos reais no método SRP-PHAT. Para isto, os experimentos foram realizados
da seguinte forma: para um determinado conjunto de posições de fonte e sensores, foram
feitas localizações usando o método SRP-PHAT com ruído branco (descorrelatado) e com
ruídos reais. As localizações foram feitas quadro a quadro, sendo que para cada sinal,
472 quadros de localização foram estimados, para o caso em que o tamanho do bloco é
de 1024 amostras. Também foram realizados experimentos com quadros de 2048 e 4096
amostras.
Os resultados da localização (taxas de acerto) considerando tamanho de quadro de
1024 amostras são apresentados na TAB. 3.6. Cada fonte acústica foi corrompida por
seis ruídos reais e ruído branco sintético (método SRP-PHAT). O localizador adotado
foi o método SRP. A taxa de acertos da localização é mostrada sob a forma percentual.
Para facilitar a visualização, foram negritadas as taxas de acertos, na TAB. 3.6, onde a
localização com ruídos reais apresentou maior diferença se comparada com a localização
com ruído branco.
52
TAB. 3.6: Resultado SRP-PHAT com ruídos reais e branco. Localização realizada por quadros de 1024amostras.
Fonte SNRTaxa de Acertos (%) quando corrompido por:
Branco V. Militar Míssil Carro Navio Assovio F16 Balbúrdia Média
Balbúrdia
0dB 12,50 57,20 32,63 54,03 26,06 44,28 8,05 0,21 31,785dB 28,81 69,07 54,24 65,68 63,35 59,32 36,02 23,31 53,0010dB 60,38 72,67 65,04 69,92 81,57 68,64 63,35 66,95 69,7315dB 91,56 85,28 68,86 91,10 86,44 70,76 73,73 72,88 78,43Média 48,71 71,05 55,19 70,18 64,35 60,75 45,29 40,84 -
Avião
0dB 33,90 88,77 68,22 93,86 68,22 91,74 41,10 59,96 73,125dB 78,60 93,43 84,75 95,76 84,96 95,34 76,69 84,11 87,8610dB 96,61 95,97 93,22 97,03 93,86 95,76 91,31 93,01 94,3115dB 98,73 97,67 96,19 97,03 96,82 97,46 95,97 95,55 96,67Média 76,96 93,96 85,59 95,92 85,96 95,07 76,27 83,16 -
Helicóptero
0dB 11,23 86,65 59,11 89,83 44,49 77,54 16,74 37,08 58,785dB 39,83 93,01 77,54 93,43 75,21 90,25 49,36 73,52 78,9010dB 74,36 95,13 90,68 94,70 90,47 93,86 77,33 90,89 90,4415dB 91,10 95,97 93,43 95,34 93,64 95,34 90,04 94,07 93,98Média 54,13 92,69 80,19 93,33 75,95 89,25 58,37 73,89 -
Motoserra
0dB 16,95 87,08 60,17 89,62 58,26 82,42 29,45 54,66 65,955dB 53,81 92,16 77,75 91,53 84,53 87,50 62,50 76,69 81,8110dB 80,72 93,43 88,14 93,64 92,37 91,31 83,69 87,29 89,9815dB 94,70 94,28 90,89 93,43 94,07 93,01 89,62 91,74 92,43Média 61,55 91,74 79,24 92,06 82,31 88,56 66,31 77,60 -
Voz
0dB 11,86 43,64 29,87 46,82 23,52 40,04 15,04 27,33 32,325dB 27,33 48,52 40,25 52,12 40,04 48,31 31,36 40,89 43,0710dB 40,25 50,42 49,15 54,45 52,33 53,81 44,70 50,21 50,7315dB 49,79 52,54 53,39 55,93 56,14 56,36 52,33 55,72 54,63Média 32,31 48,78 43,17 52,33 43,01 49,63 35,86 43,54 -
Metralhadora
0dB 7,20 22,46 17,37 24,36 9,32 25,00 9,11 9,96 16,805dB 15,04 27,54 23,52 29,24 20,97 26,69 14,62 17,16 22,8210dB 22,25 29,24 27,33 30,93 32,20 29,03 22,46 25,85 28,1515dB 32,42 29,66 29,03 31,78 36,23 31,57 29,66 29,45 31,05Média 19,23 27,22 24,31 29,08 24,68 28,07 18,96 20,60 -
Os resultados mostram que há uma grande variação na taxa de acertos de localização
de fontes corrompidas por ruídos reais quando comparadas com as taxas obtidas para
o ruído branco. Isto demonstra o quanto a correlação entre o sinal e ruído pode afetar
a localização. A fonte Balbúrdia apresentou uma taxa de acertos de 28,81% quando
submetida a um ruído descorrelatado para SNR de 5 dB. Ao ser corrompida pelo ruído
Navio, sob mesma SNR, a taxa de acerto obtida é de 63,35%, uma diferença de 34,54%.
Mesmo para valores mais elevados de SNR (15 dB), onde o ruído tem menor in�uência,
a diferença ainda é elevada, alcançando 22,70% para o ruído Míssil e 20,80% quando a
distorção é causada pelo ruído Assovio. Percebe-se ainda que para a SNR de 15 dB, o
ruído Míssil é o que resulta em menor taxa de acerto dentre os demais ruídos. Este fato
pode ser explicado pelo seu elevado valor de INS, como mostrado na FIG. 3.7.
Analisando o caso da fonte Voz, altamente não-estacionária, veri�ca-se que de modo
geral, as taxas de acerto são bem menores que as obtidas para as demais fontes. Por
53
exemplo, a média de acertos para SNR de 15 dB não chega a 55,00%, em contraste com
a da fonte Avião, estacionária, que atinge 96,67%. Vale ressaltar que para o sinal Voz,
também se nota a diferença entre a localização com distorção causada por ruídos reais
e quando considera-se a situação original de descorrelação (ruído branco). O caso em
que a SNR é 0 dB e ruído descorrelatado, resulta em 11,86% de acerto, sendo que para
uma distorção adicionada pelo Carro, faz com que a taxa de acertos seja de 46,82%, uma
diferença de 34,96%.
Pode-se notar que todos os resultados de localização com ruídos reais diferiram dos
obtidos com ruído descorrelatado. Observou-se que fontes consideradas como muito não-
estacionárias (Voz, Metralhadora) são mais difíceis de se localizar, ao contrário das fontes
estacionárias (Avião), onde foram obtidas as maiores taxas de acerto.
Os resultados de localização obtidos para os tamanhos de quadros N = 2048 e N =
4096 estão ilustrados na FIG. 3.10, cuja taxa de acertos foram obtidas por todos os
valores de SNR para as fontes Motoserra, Balbúrdia e Avião. O eixo das ordenadas de
cada curva representa o ruído utilizado para corromper a fonte, conforme legenda da
própria �gura. A linha tracejada é a média da taxa de acertos observada na localização
quando o ruído é considerado descorrelatado e as linhas em vermelho, representam a taxa
de acertos de localização considerando distorções causadas pelos ruídos reais. A primeira
observação que se faz quanto aos resultados é que a localização das fontes considerando
ruídos reais continua diferindo dos obtidos quando o ruído é descorrelatado, mesmo para os
quadros maiores usados na localização. Por exemplo, para a fonte Motoserra corrompida
com ruído Carro, observou-se 20,00% de diferença dos resultados da localização com
ruído descorrelatado. A fonte Avião, considerada estacionária, adicionada ao mesmo ruído
resultou em uma diferença menor, inferior a 10,00%. Balbúrdia apresentou resultados
intermediários, 18,00% para o caso em que o ruído Carro era empregado. Apesar de
Balbúrdia e Motoserra serem não-estacionários, o segundo foi classi�cado como altamente
não-estacionário. Destes resultados, pode-se perceber que houve signi�cativa melhora
nos resultados de localização para as três fontes, porém, a diferença de valores obtidos
considerando-se ruídos reais e o ruído descorrelatado continua evidente. Nota-se também
que o aumento da taxa de acertos acompanhou o aspecto da não-estacionaridade, sendo
que a fonte mais não-estacionária, Motoserra, apresentou menor melhora de resultados se
comparados com as outras duas fontes.
54
(a) (b)
(c) (d)
(e) (f)
FIG. 3.10: Resultado da localização de fonte usando método SRP-PHAT e SRP com ruídos reais. Aslinhas em azul indicam a média de acertos de localização. As linhas em vermelho são as médias de acertosobtida considerando ruído descorrelatado. A �gura ilustra a média de acertos de localização das fontesMotoserra (a) e (b), Balbúrdia (c) e (d) e Avião (e) e (f). Os grá�cos (a), (c) e (e) mostram o resultadocom blocos de 2048 amostras, já (b), (d) e (f) apresentam-no para a localização realizada com quadrosde 4096 amostras.
3.3.5 RESULTADOS DE LOCALIZAÇÃO COM O MÉTODO PROPOSTO SRP-H-
PHAT
Os experimentos realizados para validar a proposta deste trabalho foram implementa-
dos considerando o mesmo cenário mencionado para a análise do SRP-PHAT. O principal
objetivo do método proposto é avaliar o desempenho do método na localização de fontes
na presença de ruídos reais.
55
TAB. 3.7: Resultado SRP-H-PHAT. Localização realizada por quadros de 1024 amostras.
Fonte SNRTaxa de Acertos (%) quando corrompido por:
Branco V. Militar Míssil Carro Navio Assovio F16 Balbúrdia Média
Balbúrdia
0dB 12,50 11,86 9,75 5,72 11,65 12,29 5,72 9,11 9,445dB 28,81 30,08 25,42 23,94 31,14 29,45 23,94 26,06 27,1510dB 60,38 61,44 58,47 61,44 64,19 60,17 62,29 62,71 61,5315dB 100,00 85,59 84,96 87,50 86,65 86,23 88,77 88,14 86,83Média 50,42 47,25 44,65 44,65 48,41 47,03 45,18 46,50 -
Avião
0dB 33,90 44,92 41,31 25,00 38,14 43,64 23,94 29,24 35,175dB 78,60 84,11 84,32 77,54 80,51 82,20 76,48 77,12 80,3310dB 96,61 96,19 97,67 95,76 96,61 95,34 95,13 94,49 95,8815dB 98,73 98,52 99,15 97,46 98,31 97,88 97,46 97,46 98,03Média 76,96 80,93 80,61 73,94 78,39 79,77 73,25 74,58 -
Helicóptero
0dB 11,23 20,76 19,07 7,84 14,62 16,74 8,26 12,71 14,295dB 39,83 49,58 47,88 36,44 44,28 45,13 32,63 41,74 42,5210dB 74,36 79,66 75,42 75,42 76,06 75,00 71,61 75,64 75,5415dB 91,10 91,31 90,04 91,74 90,25 91,74 90,68 90,68 90,92Média 54,13 60,33 58,10 52,86 56,30 57,15 50,79 55,19 -
Motoserra
0dB 16,95 26,69 23,73 17,37 21,61 22,46 13,56 16,10 20,225dB 53,81 60,17 56,57 53,81 57,20 59,11 50,42 56,36 56,2310dB 80,72 86,02 83,47 81,57 81,99 84,53 85,17 83,26 83,7215dB 94,70 94,92 94,70 94,07 93,86 94,92 95,76 94,49 94,67Média 61,55 66,95 64,62 61,71 63,67 65,25 61,23 62,55 -
Voz
0dB 11,86 15,25 16,53 8,47 12,50 12,71 10,38 9,75 12,235dB 27,33 29,87 31,99 22,67 28,18 27,54 23,94 26,48 27,2410dB 40,25 43,64 43,86 39,19 42,80 44,07 38,77 41,95 42,0415dB 49,79 53,39 54,45 51,69 53,81 53,39 52,75 53,18 53,24Média 32,31 35,54 36,71 30,51 34,32 34,43 31,46 32,84 -
Metralhadora
0dB 7,20 8,90 8,69 5,30 9,96 7,63 6,99 6,99 7,785dB 15,04 18,64 17,58 15,04 18,22 14,62 11,86 17,80 16,2510dB 22,25 27,75 25,42 25,85 25,00 23,94 21,61 27,33 25,2715dB 32,42 33,26 35,17 34,53 33,69 31,14 31,57 34,96 33,47Média 19,23 22,14 21,72 20,18 21,72 19,33 18,01 21,77 -
A TAB. 3.7 apresenta os resultados obtidos pelo método SRP-H-PHAT para o tamanho
de quadros N = 1024. Nos experimentos, cada ruído real foi representado por um processo
fGn com parâmetro H estimado do sinal recebido pelo sensor (sinal + ruído), assim como
a média e variância. Este procedimento foi realizado com todas as fontes com cada um
dos seis ruídos previamente mencionados. Além de variar o parâmetro de Hurst do fGn,
diferentes valores de SNR foram empregados.
Os resultados demonstram que o método proposto apresenta as taxas de acerto bem
mais próxima as de uma localização com ruídos reais do que o SRP-PHAT, que considera
a descorrelação entre sinal e ruído. Isto signi�ca que a correlação existente entre sinal e
ruído não pode ser desprezada, como é feito no método SRP-PHAT. A fonte Balbúrdia
quando corrompida pelo ruído F16, a um valor de SNR de 10 dB obteve uma taxa de
acerto de 63,35%, e para esta mesma situação, o SRP-H-PHAT com fGn, apresenta uma
taxa de 62,29%, uma diferença de apenas 1 ponto percentual. Já com ruído branco,
este valor cai para 60,38%, elevando a diferença em quase 3 pontos percentuais. A fonte
56
Avião corrompida com Veículo Militar, SNR de 10 dB, apresentou uma taxa de acerto
de 95,97%, sendo que para o método proposto, a taxa obtida é de 96,19%, ou seja, mais
próxima do real do que o método que considera o ruído branco, que obteve para este
caso, uma taxa de 96,61%. A fonte Voz, considerada como altamente não-estacionária,
apresentou uma taxa de acertos igual a 55,72% quando corrompida pelo ruído Balbúrdia,
para o valor de SNR de 15 dB. O método SRP-PHAT, para esta mesma situação, obteve
uma taxa de 49,79%, uma diferença de 5,93%. O método proposto gerou uma taxa de
acertos de 53,18%, uma diferença de 2,54% entre o valor obtido pelo ruído real. A fonte
Metralhadora, cujo sinal é considerado o mais não-estacionário dentre os demais, quando
corrompida com o ruído Míssil, classi�cado como altamente não-estacionário, a um valor
de SNR de 5 dB, resultou em uma taxa de acertos de 17,58% pelo método SRP-H-PHAT,
e 15,04% com o SRP-PHAT, ou seja, a diferença entre a localização com o ruído real foi
de 5,94% e 8,48%, respectivamente, onde percebe-se novamente que o resultado obtido
pelo método proposto é mais próximo do que o SRP-PHAT.
Dos experimentos com quadros de N = 2048 amostras, os resultados obtidos estão
mostrados nas FIG. 3.11. As curvas ilustram a média das taxas de acertos para cada
fonte, também nesta situação, em função da razão sinal-ruído. Esta média foi calculada
dentre todas as taxas de acertos obtidas da localização de uma fonte com todos os seis
ruídos. Os resultados demonstram que o método proposto permite localizar as fontes de
sinal de forma mais próxima a de uma localização com ruídos reais, do que quando o ruído é
considerado como descorrelatado. A fonte Voz, altamente não-estacionária, apresentou um
resultado favorável em relação ao método proposto, mantendo uma diferença de quase 10%
do SRP-PHAT para todos os valores de SNR abaixo de 15 dB. O mesmo comportamento
pode ser observado na fonte Balbúrdia, apesar da diferença ser um pouco menor do que no
caso da Voz. Novamente, isto pode ser explicado pelo fato de Balbúrdia possuir menores
valores de INS do que a Voz. Observa-se que para a fonte Avião, a média das taxas de
acerto de ambos os métodos �caram muito próximas. Isto se deve ao fato de que esta
fonte é estacionária e possui um valor de H próximo ao de um sinal gaussiano branco,
para o qual o SRP-PHAT foi proposto originalmente. Os testes também con�rmaram que
a não-estacionaridade também está relacionada com o desempenho da localização, pois
nota-se que quanto mais não-estacionário é uma fonte de sinal, mais erros ocorrem na
sua localização. Isto pode ser percebido através da análise dos valores da taxa de acertos
das fontes. Por exemplo, a fonte Avião possui média de acertos superiores a 80% para
57
(a) Avião (b) Balbúrdia
(c) Helicóptero (d) Motoserra
(e) Voz (f) Metralhadora
FIG. 3.11: Comparação entre localização obtida pelos métodos SRP-PHAT e SRP-H-PHAT com quadrosde N = 2048 amostras. A linha em azul mostra o resultado médio obtido na localização das fontes quandoo ruído real é empregado. Já o traço em verde representa a meta que se deseja alcançar no método delocalização.
valores de SNR de 0 dB, que é a pior situação considerada nos experimentos. Para este
mesmo valor, a fonte Helicóptero apresenta taxa de apenas 32% enquanto as duas mais
não-estacionárias, Voz e Metralhadora não acertam mais de 25% e 20%, respectivamente.
Com relação aos resultados para o tamanho de quadro de N = 4096, apresentados na
FIG. 3.12, observa-se para alguns casos, a diferença de resultados obtidos pelo SRP-PHAT
comparados com os do método proposto, aumenta de forma signi�cativa. Isto pode ser
observado para a fonte Balbúrdia. Nota-se que a fonte Avião apresenta uma elevada média
de taxa de acertos para o tamanho de quadro maior. Embora de forma menos expressiva,
este aumento da taxa de acertos também ocorre nas demais fontes. Isto mostra que o
aumento do tamanho de quadros, ou seja, da quantidade de amostras observadas de um
sinal, é possível melhorar o desempenho dos métodos de localização. Além disto, percebe-
se que este aumento depende também do índice de não-estacionaridade das fontes, pois as
fontes com um maior valor de INS apresentaram um menor aumento na taxa de acertos
com relação às fontes de menor INS.
58
(a) Avião (b) Balbúrdia
(c) Helicóptero (d) Motoserra
(e) Voz (f) Metralhadora
FIG. 3.12: Comparação entre localização obtida pelos métodos SRP-PHAT e SRP-H-PHAT com quadrosde N = 4096 amostras. A linha em azul mostra o resultado médio obtido na localização das fontes quandoo ruído real é empregado. Já o traço em verde representa a meta que se deseja alcançar no método delocalização.
3.4 RESUMO
Este Capítulo apresentou o principal método de localização de fontes acústicas da
literatura, baseado em TDE, SRP-PHAT, sendo mesmo de�nido matematicamente e sua
principal limitação foi exposta. Com �nalidade de melhorar o método SRP-PHAT, foi pro-
posto um método de localização que utiliza o expoente de Hurst para modelar a correlação
existente entre sinal e ruído. Diversas simulações foram realizadas, onde mostrou-se que
o método SRP-PHAT difere muito em seus resultados quando comparado a localiza-
ção obtida por ruídos reais. Por �m, mostrou-se também que o método SRP-H-PHAT
apresentou resultados mais próximos ao obtido por localização de fontes reais, do que o
localizador SRP-PHAT.
59
4 LOCALIZAÇÃO DE FONTES BASEADA EM ENERGIA ACÚSTICA
Os métodos de localização de fontes baseados em medições de energia ou intensidade
acústica consideram que um sinal acústico emitido por uma fonte tem sua energia atenuada
em função da distância que separa a fonte do receptor. Logo, é possível se relacionar as
posições de vários sensores com a energia recebida e obter-se a localização espacial da
fonte geradora do sinal.
O primeiro método de localização baseado em energia foi proposto em (LI, 2003),
com uso de rede sensores sem �o para a localização de fontes acústicas. O principal
objetivo era de localizar fontes de sinais em ambiente aberto ou urbanos. A con�guração
dos sensores da rede de sensores sem-�o é do tipo ad-hoc10. Isto signi�ca que, embora
a posição dos sensores da rede tivesse que ser conhecida a priori, estes poderiam estar
dispostos em qualquer con�guração, diferentemente do que acontece, por exemplo, em
um conjunto de microfones, muito empregado nos métodos de localização baseados em
retardo temporal. Na localização em campo aberto, diferentes fatores podem degradar os
resultados de localização tais como, a ocorrência de reverberação na área onde a fonte e os
sensores estão inseridos causada por construções e rochas, o impacto causado pela direção
do vento (LI, 1994). A presença de vegetação densa no local, a imprecisão na determinação
das posições dos sensores, o fato de fontes acústicas reais não serem omnidirecionais e forte
ruído de fundo presente em ambientes externos.
Apesar de saber que o ruído de fundo é um fator impactante na acurácia da localização
com método baseado em EA, considera-se, por simplicidade, que o ruído que distorce o
sistema é descorrelatado do sinal. No entanto, conforme demonstrado no Capítulo 3, a
localização de fonte é degradada quando seu sinal é corrompido por ruído real, ou seja,
correlatado com o sinal.
Neste Capítulo é proposto e analisado um método de localização de fontes de sinais
acústicos baseado em medições de energia, que considera que os sensores são corrompidos
por ruídos acústicos não-estacionários e correlacionados com a fonte de sinal. Com isto,
pretende-se superar uma das limitações do método original, tornando a localização das
10Rede onde os seus componentes trocam informações entre si, sem precisar de um agente central para
isto.
60
fontes acústicas mais robusta.
4.1 MÉTODO ML-ENERGIA
O método de localização de múltiplas fontes baseado na máxima verosimilhança
de medições de energia acústica (Maximum Likelihood Multiple-Source Localization Us-
ing Acoustic Energy Measurements), aqui abreviado por ML-Energia, foi proposto em
(SHENG, 2005), com objetivo de localizar múltiplas fontes em ambiente aberto. O uso da
máxima verosimilhança é caracterizado por propriedades estatísticas ótimas e apresenta
robustez em cenários de baixa razão sinal-ruído, mesmo quando as fontes de sinal estão
posicionadas muito próximas (CHUNG, 2012). No Capítulo 2, diversos métodos propos-
tos baseados em EBL foram apresentados, sendo ao �nal, o ML-Energia indicado como
o de melhor resultado dentre os demais. Por este motivo, ele foi selecionado para este
trabalho como referência, e um maior detalhamento é apresentado na sequência.
Seja um campo aberto, sem obstáculos e com velocidade do vento constante e uni-
forme v onde K fontes de sinais acústicos estão posicionadas. Neste ambiente, são in-
seridos L sensores de energia, cada um com a posição espacial conhecida e dada por ri
(i = 1, 2, ..., L). A amplitude de um sinal acústico que se propaga de forma omnidire-
cional, se atenua a uma taxa inversamente proporcional a distância entre fonte e receptor
(KINSLER, 1982). Assim, o sinal recebido em cada um dos L sensores é dado por
xi(n) = Ai(n) + wi(n), (4.1)
onde
Ai(n) = λi
K∑j=1
sj(n− τji)|pj(n− τji)− ri|
(4.2)
é a amplitude medida no i-ésimo sensor devido a contribuição das K fontes de sinais. O
vetor pj representa as coordenadas da posição espacial da fonte j (j = 1, 2, ..., K), wi(n)
é o ruído, modelado como descorrelatado e gaussiano de média nula e variância Σ2i . A
amplitude de cada fonte de sinal j é representada por sj(n − τji), sendo τji o retardo
temporal devido ao tempo de propagação da fonte j para o sensor i. λi é o ganho do
61
sensor i. A energia acústica, é de�nida como E[x2i (n)] = ui(t), ou
ui(t) = λ2i .
K∑j=1
E[s2j(n− τji)]|pj(t− τji)− ri|a
+ E[w2i (t)] + 2E[Ai(t)wi(t)] (4.3)
ui(t) = gi.
K∑j=1
Bj(t− τji)|pj(t− τji)− ri|a
+ E[w2i (t)] + 2E[Ai(t)wi(t)] (4.4)
onde, Bj(t) é a energia do sinal acústico gerado pela fonte j, gi é o ganho de energia do
i-ésimo sensor, a é a constante de decaimento da energia, geralmente aproximado para 2
(LI, 2003). Nota-se que o termo cruzado E[Ai(t)wi(t)] é igual a zero, pois o modelo do
ML-Energia supõe que sinal e ruído são descorrelatados entre si.
Como as medições de energia são realizadas em quadros de N amostras dos sinais
recebidos em cada sensor e, considerando que os retardos temporais in�uenciam pouco
na variação de energia dentro de um período de curta duração, os autores aproximam
Bj(t − τji) para Bj(t) e pj(t − τji) para pj(t). Assim, a EQ. 4.4 torna-se mais concisa e
o sinal de energia recebido em cada sensor ui(t) é
ui(t) = gi
K∑j=1
Bj(t)
d2ij(t)+ εi(t) (4.5)
onde dij(t) = |pj(t) − ri| é a distância Euclidiana que separa a fonte j do sensor i e
εi(t) representa a energia do ruído aditivo. No ML-Energia, εi(t) é representado por uma
distribuição gaussiana, com média µi = Σ2i e variância σ
2i = 2Σ4
i /N , sendo N a quantidade
de amostras de um quadro do sinal utilizado para estimar a energia. Com o objetivo de
reescrever as medições de energia acústica ui(t) em termos de uma função densidade
de probabilidade condicional dos parâmetros desconhecidos (posição das fontes e suas
energias), para todos os sensores considerados, foram de�nidas as seguintes matrizes,
Z =[
u1−µ1σ1
... uL−µLσL
]TG = diag
[g1σ1
g2σ2
... gLσL
]
D =
1d211
1d212
... 1d21K
1d221
1d222
... 1d22K
......
. . ....
1d2L1
1d2L2
... 1d2LK
62
B =[B1 B2 ... BK
]TH = GD
ξ =[ε1 ε2 ... εL
]T, (4.6)
onde Z representa a matriz das leituras de energia normalizadas, G é a matriz de ganhos,
D a matriz de atenuações, B indica a matriz de energia acústica das fontes e ξ representa
a matriz de erro.
Assim, pode-se reescrever a EQ. (4.5) como
Z = GDB + ξ. (4.7)
A função densidade de probabilidade conjunta de Z pode ser expressa, na forma ma-
tricial, por
f(Z|θ) = (2π)−N/2exp{−1
2(Z−HB)T (Z−HB)} (4.8)
onde,
θ =[
pT1 pT2 ... pTK B1 B2 ... BK
]T(4.9)
é o vetor que contém a posição pj de cada fonte e sua respectiva energia Bj. Aplicando-se
o logaritmo na EQ. 4.8, obtém-se a função de máxima verossimilhança a ser minimizada
(CHUNG, 2012), expressa por
L(θ) = ||Z−GDB||2. (4.10)
Note que a EQ. 4.10 é não-linear e possui K(p + 1) parâmetros desconhecidos, onde
p é a dimensão do vetor de coordenadas pk, o que exige um mínimo de K(p + 1) sen-
sores no campo de localização para obter-se uma solução única. O algoritmo proposto
por (SHENG, 2005) para minimizar a função de máxima verossimilhança é o da busca
de multi-resolução (MR - Multiresolution Search). Este método consiste em efetuar a
varredura do campo dos sensores em uma resolução menor inicialmente em busca do
ponto de mínimo. Em seguida, efetuam-se novas buscas com maior resolução em torno do
ponto de mínimo encontrado. Embora seja uma técnica que reduz o custo computacional
de forma considerável, o método pode fazer com que a busca inicial se aproxime de um
mínimo local, levando a erros na estimação.
63
4.2 MÉTODO PROPOSTO H-ML-ENERGIA
Este trabalho propõe um novo método de localização de fontes acústicas baseado no
método ML-Energia. O principal objetivo é melhorar a localização das fontes acústicas,
pois pretende-se não mais considerar que o ruído de fundo que distorce os sensores de
energia seja descorrelatado.
Nesta proposta, será considerado que existe correlação entre sinais e ruídos, e a fre-
quência da correlação caracterizada pelo expoente de Hurst11 (0 ≤ H ≤ 1) e representada
por um processo fGn. De acordo com método ML-Energia, EQ. 4.4, e considerando que
existe correlação entre sinal e ruído, a energia recebida em cada sensor é
ui(t) = gi.K∑j=1
Bj(n− τji)|pj(n− τji)− ri|a
+ E[w2i (n)] + 2E[wi(n)Ai(n)], (4.11)
onde a correlação entre sinal e ruído é expressa por E[wi(n)Ai(n)]. Neste trabalho, propõe-
se que esta parcela que expressa a energia do ruído seja representada por um ruído fra-
cionário gaussiano (fGn), cujo parâmetroH, associado com a correlação entre sinal e ruído,
será dado pelo valor do expoente de Hurst estimado dos sinais distorcidos recebidos, e
média e variância pelas estimativas recebidas pelos diferentes sensores. Assim,
ui(t) = gi.K∑j=1
Bj(n− τji)|pj(n− τji)− ri|a
+ E[wH2i (n)], (4.12)
sendo E[wH2i (n)] a energia do fGn com média νHi
, variância ΣHie com parâmetro H
estimado do sinal recebido no sensor (xi(n)), que representa a correlação entre sinal e
ruído. Considerando que durante um quadro de localização não há muita variação na
energia do sinal, os retardos temporais podem ser desprezados, assim, pode-se reescrever
a EQ. 4.12 de forma simpli�cada,
ui(t) = gi
K∑j=1
Bj(t)
d2ij(t)+ ε(t), (4.13)
onde ε(t) representa a energia do fGn, representado por E[w2H(n)]. Como o ruído aditivo
é modelado por um fGn, o quadrado de seus valores também pode ser caracterizado por
um fGn com média representada por µHie variância σHi
.
11De�nições e conceitos acerca do expoente de Hurst e do processo fGn estão apresentadas no Capítulo
3.
64
Para obter-se a função densidade de probabilidade condicional da energia em cada
sensor ui(t), em função da posição das fontes e suas energias, são de�nidas as matrizes,
ZH =[
u1−µH1
σH1...
uL−µHL
σHL
]TGH = diag
[g1σH1
g2σH2
... gLσHL
]
D =
1d211
1d212
... 1d21K
1d221
1d222
... 1d22K
......
. . ....
1d2L1
1d2L2
... 1d2LK
B =
[B1 B2 ... BK
]TH = GHD
Λ =[ε1 ε2 ... εN
]T, (4.14)
e a EQ. (4.13) pode ser reescrita como
ZH = GHDB + Λ. (4.15)
Logo, a EQ. 4.15 pode ser expressa em termos de uma função de máxima verosimi-
lhança, dada pela EQ. 4.5, resultado em f(ZH|θ) = (2π)−N/2exp{−12(ZH −HB)T (ZH −
HB)}, cujo logaritmo é dado por
L(θ) = ||ZH −GHDB||2. (4.16)
A busca da solução da função de máxima-verosimilhança é também realizada pelo método
adotado no ML-Energia, através da busca de multi-resolução. Por considerar o expoente
de Hurst como parâmetro, o método passará a ser referenciado como H-ML-Energia.
4.3 RESULTADOS DOS EXPERIMENTOS
O objetivo desta Seção é mostrar através de testes e simulações que o método ML-
Energia apresenta degradação nos resultados de localização quando o ruído aditivo passa
a ter correlação com o sinal. Além disto, pretende-se veri�car que o método proposto, H-
ML-Energia, possibilita obter-se resultados mais próximos aos reais se comparado com o
primeiro. Neste Capítulo adota-se também a distância de Bhattacharyya para evidenciar
o quanto os erros de localização obtidos de um metro se assemelham ou se distanciam um
dos outros.
65
4.3.1 DISTÂNCIA DE BHATTACHARYYA
A distância de Bhattacharyya (BHATTACHARYYA, 1943) foi proposta em
(KAILATH, 1967) como critério para seleção de sinais baseado na distribuição de suas
amplitudes.
Considere queX1 eX2, são variáveis aleatórias com funções densidade de probabilidade
p1(x) e p2(x), respectivamente. O coe�ciente de Bhattacharyya (CB) é de�nido como,
CB =
∫ ∞−∞
√p1(x) p2(x) dx . (4.17)
a distância Bhattacharyya (dB) entre as distribuições de X1 e X2 então é dada por
dB(X1, X2) = −ln CB = −ln∫ ∞−∞
√p1(x) p2(x) dx . (4.18)
A de�nição da EQ. 4.18 obedece às propriedades de simetria, positividade, e se anula
apenas para distribuições idênticas. Ou seja,
a) dB(X1, X2) = dB(X2, X1);
b) 0 ≤ dB(X1, X2) <∞;
c) dB(X1, X2) = 0⇔ p1(x) = p2(x), para todo x.
Neste trabalho, a distância Bhattacharyya (dB) é utilizada para comparação dos resul-
tados obtidos da localização das fontes de sinais acústicos entre os métodos ML-Energia
e o proposto.
4.3.2 CENÁRIO DOS EXPERIMENTOS
Diversos experimentos foram elaborados para avaliar as técnicas de localização de
fontes baseados em energia. Os métodos foram implementados utilizando linguagem
C/C++. As fontes de sinais utilizadas foram Avião, Balbúrdia, Helicóptero, Motoserra,
Voz e Metralhadora, e os ruídos Navio, Carro, F16, Veículo Militar, Assovio e Míssil foram
empregados para simular a distorção nos sensores. Detalhes sobre os sinais e ruídos são
encontrados na TAB. 3.1. A duração dos sinais e ruídos é de 30 segundos e taxas de
amostragem de 16 kHz.
Para a localização, uma área quadrada de 50 x 50 metros foi adotada, com a origem
no centro. Quatro sensores de energia foram posicionados de forma aleatória, com ganhos
66
gi adotados, por simplicidade, como iguais a 1. Nos experimentos, apenas uma fonte
foi considerada para a localização de cada vez, de forma a melhor averiguar o efeito
da distorção acústica na localização. A posição da fonte dentro do campo de sensores
também é escolhida de forma aleatória. A localização foi realizada por diferentes quadros
do sinal, sendo que cada quadro forneceu uma posição estimada da fonte de sinal. Os
tamanhos de quadros adotados foram de N = 1024, N = 2048 e N = 4096 amostras,
sem sobreposição. A energia da fonte Sk(t) foi determinada pelos valores das amostras
dos sinais recebidos pelos sensores. Os resultados são apresentados para valores de SNR
entre 0 dB e 20 dB, com incrementos de 5 dB. Apesar de, em uma situação real, o valor
de SNR depender da distância entre fonte de sinal e sensor de energia, para as simulações
�xou-se a mesma razão sinal-ruído para todos os sensores, independente de sua posição.
As leituras de energia foram geradas de acordo com a EQ. 4.5 (ML-Energia) e a EQ. 4.13
(H-ML-Energia).
Para os experimentos com o método proposto, o valor de H empregado foi estimado do
sinal corrompido com o ruído12. O ruído branco utilizado para simulação do ML-Energia
foi gerado pelo método de Box-Muller (BOX, 1958) e o ruído fGn foi simulado pela técnica
do deslocamento de ponto médio (midpoint displacement) (BARNSLEY, 1988).
4.3.3 RESULTADOS DO ML-ENERGIA COM RUÍDOS REAIS
Em uma primeira situação, foram avaliadas distintas localizações com o método ML-
Energia utilizando o ruído branco gaussiano, conforme na proposta original e, também,
com os ruídos reais escolhidos. Embora o método ML-Energia forneça a posição estimada
da fonte a ser localizada, neste trabalho o critério de comparação empregado é o de erro
de estimação (Ek) da posição, de�nido como a distância (em metros) entre a posição real
da fonte e a estimada, ou seja,
Ek =√|rk − rk|2, (4.19)
onde rk simboliza a posição estimada obtida em cada quadro do sinal. Ao �nal de cada
localização, os erros de estimação foram agrupados e ilustrados sob a forma de histogramas
normalizados, com uma faixa de 0 a 80 metros e 25 divisões de 3,2 metros cada. Os
valores das médias e desvio padrão dos resultados estão também apresentados junto aos
histogramas.
12O método baseado em wavelets foi utilizado. Os �ltros e coe�cientes são apresentados no Capítulo 3,
TAB. 3.2.
67
(a) Avião + Branco (b) Avião + Carro (c) Avião + F16 (d) Avião + Míssil
(e) Balbúrdia +Branco
(f) Balbúdia +Carro
(g) Balbúrdia + F16 (h) Balbúrdia +Míssil
(i) Helicóptero +Branco
(j) Helicóptero +Carro
(k) Helicóptero +F16
(l) Helicóptero +Míssil
FIG. 4.1: Resultado da localização utilizando ML-Energia com ruídos reais. Os histogramas mostramo erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinado ruído,mencionado na legenda, a um valor de SNR de 5 dB.
A FIG. 4.1 apresenta 3 linhas e 4 colunas de histogramas, sendo que as linhas represen-
tam, de cima para baixo, as fontes Avião, Balbúrdia e Helicóptero, respectivamente, e as
colunas indicam, o ruído de fundo utilizado, respectivamente da esquerda para a direita,
Branco, Carro, F16 e Míssil. A razão sinal-ruído empregada para neste caso é a de 5 dB.
De acordo com os resultados obtidos no Capítulo 3, Carro é considerado um ruído esta-
cionário, F16 é não-estacionário e Míssil foi classi�cado como altamente não-estacionário
(Vide FIG. 3.7).
Percebe-se que o resultado do ML-Energia com ruído branco difere muito dos cor-
respondentes quando considera-se ruído real. Isto pode ser observado, por exemplo, nos
histogramas da fonte Avião, onde de uma média de erro igual a 3,81 metros na localização
com o ruído Branco, atinge um aumento para 17,14 metros quando o ruído de fundo é
o Míssil. Resultado semelhante pode ser notado para a fonte Balbúrdia, que apresentou
média de erro 4,32 metros com distorção pelo ruído Branco contra 25,25 metros quando
o Míssil é o ruído de fundo. Mesmo quando o ruído aditivo é o Carro, ruído estacionário,
68
(a) Motoserra +Branco
(b) Motoserra +Carro
(c) Motoserra + F16 (d) Motoserra +Míssil
(e) Voz + Branco (f) Voz + Carro (g) Voz + F16 (h) Voz + Míssil
(i) Metralhadora +Branco
(j) Metralhadora +Carro
(k) Metralhadora +F16
(l) Metralhadora +Míssil
FIG. 4.2: Resultado da localização utilizando ML-Energia com ruídos reais. Os histogramas mostramo erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinado ruído,mencionado na legenda, a um valor de SNR de 10 dB.
a fonte Helicóptero apresentou uma diferença razoável nos resultados quando comparado
ao caso do ruído Branco. Percebe-se que para as três fontes, as maiores diferenças entre
o caso com ruído Branco se deram quando o ruído aditivo é o Míssil. Isto pode ser ex-
plicado pelo fato deste ruído ser o mais não-estacionário dentre os demais. Além disto,
a não-estacionaridade das fontes também in�uencia nos resultados. Conforme pode se
perceber que, para um mesmo ruído de fundo, a fonte mais não-estacionária apresenta
maiores erros de localização, por exemplo, para o ruído F16, a média do erro de localiza-
ção obtida com a fonte Avião é de 16,90 metros com desvio de 11,95m. Balbúrdia, sendo
mais não-estacionária, apresentou um maior erro (17,16 metros) e um maior desvio (13,13
metros). Já com a fonte Helicóptero, mais não-estacionária entre as três, erro e desvio
aumentaram para 18,05 metros e 13,81 metros, respectivamente.
A FIG. 4.2 apresenta 3 linhas e 4 colunas de histogramas, sendo que as linhas represen-
tam, de cima para baixo, as fontes Motoserra, Voz e Metralhadora, respectivamente, e as
colunas indicam, o ruído de fundo utilizado, respectivamente da esquerda para a direita,
69
Branco, Carro, F16 e Míssil. A razão sinal-ruído empregada para neste caso é a de 10 dB.
Embora para este segundo caso, a razão sinal-ruído tenha aumentado, a diferença entre os
resultados do ML-Energia com ruído Branco e com ruídos reais continua perceptível. A
fonte Motoserra apresentou uma média de erro de estimação igual a 3,37 metros, desvio
2,58 metros quando o ruído de fundo é o Branco, porém, empregando-se o F16 como
ruído, a média de erro aumenta para 10,44 metros, desvio 10,80 metros. A fonte Voz é
localizada com média de erro de 6,49 metros quando a distorção é descorrelatada, mas
dobra este valor quando o ruído aditivo é gerado pelo Carro. Com o Míssil, a média de
erro é quase triplicada. A fonte Metralhadora apresentou uma média de 10,02 metros
com o ruído Branco, aumentado para quase 15 metros quando o ruído F16 foi utilizado.
Mesmo um ruído estacionário, como é o caso do Carro, resultou em grande diferença se
comparada a localização da Metralhadora com o ruído Branco (aumento de 4 metros na
média de erro e quase 1 metro no desvio padrão).
4.3.4 RESULTADOS DE LOCALIZAÇÃO DO MÉTODO PROPOSTO H-ML-
ENERGIA
Para a avaliação do método proposto, a localização de fonte foi realizada com as
mesmas fontes e ruídos reais utilizadas para os experimentos com o ML-Energia. O erro
de estimação foi computado e obtidos diversos histogramas correspondentes.
A FIG. 4.3 apresenta 3 linhas e 3 colunas de histogramas, sendo que as linhas represen-
tam, de cima para baixo, as fontes Avião, Helicóptero e Metralhadora, respectivamente,
e as colunas indicam qual método foi empregado, respectivamente da esquerda para a
direita, ML-Energia com ruído Branco, ML-Energia com ruídos reais e H-ML-Energia.
A razão sinal-ruído empregada para neste caso é a de 5 dB. A fonte Avião corrompida
com o ruído Branco apresentou média de erros de 3,81 metros e desvio de 2,10, sendo que
quando corrompida por um ruído real, Carro, a média e o desvio do erro é de 17,21 metros
e 10,58, respectivamente. Para este caso, o método H-ML-Energia obteve uma média de
erro de 12,41 metros e um desvio de 10,95. Note que o desvio obtido pelo H-ML-Energia
é muito próximo do obtido quando o ruído de fundo era um ruído real, com uma diferença
menor que 0,50 metro. A diferença entre o valor da média obtida também é pequena,
igual a 4,80 metros, sendo que para o ML-Energia esta diferença chega aos 13,40 me-
tros. A fonte Helicóptero obteve uma média de erro de 22,50 metros considerando o ruído
Veículo Militar real, diferindo muito da apresentada pelo ML-Energia, 13,03 metros. Para
70
esta situação, em que a fonte de sinal e o ruído são não-estacionários, o H-ML-Energia
obteve uma média 15,35 metros, logo, mais próxima do valor real que a do ML-Energia.
O terceiro caso, onde tanto a fonte, Metralhadora, quanto o ruído, Míssil, são os mais
não-estacionários dentre os sinais e ruídos selecionados, o método H-ML-Energia obteve
um resultado muito próximo ao do real, com uma diferença de apenas 1,04 metros na mé-
dia e 1,06 metros para o desvio padrão, um resultado muito superior se comparado com
o ML-Energia que para este caso obteve uma diferença de 14,75 metros e 11,50 metros,
respectivamente.
Mais uma vez, os resultados mostram que o método proposto se aproxima mais da
localização obtida quando a distorção é causada por ruídos reais do que o método ML-
Energia, que considera ruído descorrelatado com o sinal.
4.3.4.1 COMPARAÇÃO DOS MÉTODOS DE LOCALIZAÇÃO
De forma a avaliar o desempenho de localização dos métodos de energia, foi empregada
a distância de Bhattacharyya, pois pode-se realizar diversas comparações entre as fontes
com todos os ruídos e para todos os valores de SNR utilizados. Deste modo, o valor
da distância foi calculado entre os histogramas de erro do método ML-Energia e dos
ruídos reais. Da mesma forma, determinou-se as distâncias entre os resultados reais e
os gerados pelo método proposto. Todas as distâncias estão apresentadas na TAB. 4.1,
que mostra para cada fonte, a distância obtida entre os histogramas gerados pelo método
ML-Energia e o H-ML-Energia, para todos os ruídos empregados e para cada valor de
SNR. Comparando-se os métodos, um menor valor de distância indica que o método mais
se aproximou do resultado gerado pelos ruídos reais. Para facilitar a visualização, os casos
em que foram encontradas as maiores diferenças entre o H-ML-Energia e o ML-Energia
estão em negrito.
De acordo com os valores apresentados na TAB. 4.1, percebe-se que o método H-
ML obteve menores distâncias com os resultados reais, se comparado com o ML-Energia.
Para a fonte Balbúrdia, corrompida com Assovio, sob SNR de 5 dB, as distâncias obtidas
para o ML-Energia e H-ML foram 0,51 e 0,16 respectivamente, uma diferença de quase
3 vezes, ou seja, o método proposto gerou resultados 3 vezes mais semelhantes aos reais,
se comparados com o ML-Energia. Já quando a SNR é elevada para 15 dB, a diferença
aumenta para quase 4 vezes (0,26 e 0,07). A fonte Avião quando corrompida com ruído
Carro, sob SNR de 5 dB mostra valores de distância de 0,71 e 0,18 para os métodos ML-
71
(a) Avião + Branco (b) Avião + Carro (c) Avião + Carro (H-ML)
(d) Helicóptero + Branco (e) Helicóptero + V. Militar (f) Helicóptero + V. Militar(H-ML)
(g) Metralhadora + Branco (h) Metralhadora + Míssil (i) Metralhadora + Míssil(H-ML)
FIG. 4.3: Resultado da localização utilizando ML-Energia com ruídos reais e H-ML-Energia. Os histogra-mas mostram o erro de estimação de�nido na EQ. 4.19, para cada fonte corrompida com um determinadoruído, mencionado na legenda, a um valor de SNR = 5 dB.
Energia e H-ML-Energia, respectivamente, uma diferença de quase 4 vezes favorável ao
método proposto.
A comparação entre os resultados obtidos pelos métodos ML-Energia e H-ML-Energia
para os tamanhos de quadros de 2048 e 4096 amostras é ilustrada sob a forma de grá�cos
para quatro fontes de sinais, Avião, Balbúrdia, Voz e Motoserra, corrompidas com três
ruídos, sendo selecionados o Carro, ruído estacionário, Balbúrdia, por ser não-estacionário
e Míssil, classi�cado como altamente não-estacionário. Os grá�cos são apresentados nas
FIGS. 4.4 e 4.5, sendo que a primeira mostra o resultado para quadros de 2048 e a segunda,
4096 amostras.
De acordo com a FIG. 4.4, o método H-ML-Energia obteve uma maior diferença se
72
TAB. 4.1: Resultados da distância de Bhattacharyya calculada entre os histogramas de erro obtidos peloML-Energia e pelo H-ML-Energia, quando comparados com os histogramas de erro de localização comruídos reais. O tamanho do quadro considerado para este caso é o de 1024 amostras.
Fonte SNRV. Militar Míssil Carro Assovio Navio Caça
ML H-ML ML H-ML ML H-ML ML H-ML ML H-ML ML H-ML
Balbúrdia
0dB 0,22 0,18 0,44 0,42 0,22 0,09 0,18 0,14 0,46 0,31 0,40 0,07
5dB 0,40 0,21 0,77 0,75 0,44 0,18 0,51 0,16 0,72 0,48 0,36 0,3010dB 0,44 0,29 0,64 0,59 0,31 0,23 0,54 0,23 0,81 0,54 0,74 0,5715dB 0,07 0,06 0,29 0,17 0,14 0,08 0,26 0,07 0,13 0,08 0,11 0,0920dB 0,07 0,07 0,11 0,09 0,12 0,08 0,15 0,14 0,05 0,04 0,09 0,06
Avião
0dB 0,31 0,11 0,55 0,51 0,30 0,05 0,24 0,19 0,24 0,14 0,50 0,09
5dB 0,61 0,33 1,55 1,03 0,71 0,18 0,76 0,53 0,36 0,23 0,61 0,2010dB 0,25 0,19 0,92 0,86 0,30 0,20 0,67 0,52 0,20 0,14 0,65 0,43
15dB 0,12 0,08 0,23 0,22 0,12 0,09 0,39 0,26 0,05 0,04 0,08 0,0620dB 0,33 0,26 0,25 0,19 0,33 0,22 0,38 0,26 0,26 0,17 0,32 0,21
Helicóptero
0dB 0,04 0,04 0,33 0,25 0,04 0,03 0,06 0,05 0,08 0,06 0,11 0,085dB 0,04 0,03 0,38 0,25 0,04 0,03 0,05 0,05 0,05 0,04 0,10 0,0710dB 0,04 0,03 0,23 0,18 0,04 0,02 0,05 0,04 0,04 0,02 0,10 0,0715dB 0,04 0,03 0,13 0,12 0,04 0,02 0,07 0,05 0,03 0,02 0,12 0,08
20dB 0,07 0,04 0,11 0,11 0,06 0,03 0,06 0,05 0,04 0,04 0,08 0,05
Motoserra
0dB 0,16 0,12 0,57 0,38 0,16 0,05 0,14 0,14 0,12 0,08 0,29 0,135dB 0,24 0,22 0,58 0,55 0,29 0,12 0,34 0,28 0,14 0,11 0,26 0,2110dB 0,20 0,18 0,50 0,46 0,25 0,17 0,38 0,36 0,10 0,08 0,19 0,1515dB 0,08 0,08 0,29 0,29 0,14 0,14 0,25 0,25 0,04 0,04 0,08 0,0820dB 0,06 0,05 0,10 0,10 0,11 0,11 0,17 0,16 0,05 0,04 0,07 0,07
Voz
0dB 0,07 0,07 0,47 0,31 0,09 0,03 0,08 0,07 0,09 0,07 0,16 0,085dB 0,09 0,07 0,39 0,30 0,13 0,06 0,15 0,14 0,07 0,06 0,15 0,1010dB 0,08 0,07 0,36 0,24 0,10 0,08 0,14 0,14 0,05 0,04 0,10 0,0815dB 0,09 0,06 0,20 0,15 0,07 0,06 0,15 0,12 0,05 0,04 0,07 0,0620dB 0,08 0,07 0,16 0,11 0,07 0,06 0,13 0,10 0,06 0,04 0,08 0,05
Metralhadora
0dB 0,32 0,25 0,47 0,32 0,15 0,12 0,27 0,18 0,58 0,39 0,14 0,095dB 0,49 0,33 0,34 0,26 0,31 0,21 0,29 0,22 0,52 0,40 0,39 0,2610dB 0,35 0,23 0,28 0,19 0,29 0,22 0,34 0,23 0,37 0,29 0,34 0,2315dB 0,18 0,14 0,14 0,11 0,21 0,14 0,22 0,17 0,20 0,13 0,17 0,1220dB 0,19 0,13 0,19 0,13 0,24 0,16 0,24 0,16 0,17 0,11 0,15 0,10
comparado com o ML-Energia para todas as combinações e ruídos apresentadas. A dis-
tância calculada para a fonte Avião corrompida com Carro, foi de 0,57 para o ML-Energia
contra 0,02 obtida pelo método H-ML-Energia, para o valor de SNR de 0 dB. As maiores
diferenças podem ser observadas para a fonte Balbúrdia corrompida por Míssil, onde
o ML-Energia apresentou uma distância de Battacharyya próxima de 1,98, enquanto o
método proposto atingiu um valor de 0,5. Para o caso da fonte Voz corrompida com
Balbúrdia, o H-ML apresentou diferença de 0,20 na distância com relação ao ML-Energia
para os valores de 0 dB e 5 dB. Frente aos resultados, percebe-se que os resultados são
favoráveis ao método proposto, mesmo sendo as fontes e ruídos não-estacionários.
Da análise da FIG. 4.5, onde a distância de Bhattacharyya é mostrada para a localiza-
ção com quadros maiores (4096 amostras), percebe-se um aumento do valor da distância
para a fonte Avião, corrompida pelo ruído Carro, principalmente entre 0 dB e 5 dB. A
fonte Voz corrompida pela Balbúrdia apresentou uma diferença de distância próxima de
73
(a) Avião + Carro (b) Avião + Balbúrdia (c) Avião + Míssil
(d) Balbúrdia + Carro (e) Balbúrdia + Balbúrdia (f) Balbúrdia + Míssil
(g) Voz + Carro (h) Voz + Balbúrdia (i) Voz + Míssil
(j) Motoserra + Carro (k) Motoserra + Balbúrdia (l) Motoserra + Míssil
FIG. 4.4: Distância de Bhattacharrya entre ML-Energia e ruídos reais (em vermelho) e H-ML-Energia eruídos (linhas azuis), para os valores de SNR entre 0 dB e 20 dB e quadros de 2048 amostras.
0,30 para 0 dB e 5 dB. Uma diferença elevada também pode ser vista para a fonte Mo-
toserra corrompida com Balbúrdia, mesmo sendo tanto fonte quanto ruído de elevada
não-estacionaridade. Se a comparação for feita entre ambos os grá�cos, pelo número de
amostras, percebe-se que ocorreu um aumento na diferença entre as distâncias do ML-
Energia e H-ML-Energia. Isto pode ser percebido de forma mais notável para os casos
da fonte Motoserra com ruído Míssil e para Motoserra adicionada com Balbúrdia. Esta
maior diferença é re�exo de um maior número de amostras utilizados no quadro, o que faz
com que o valor do expoente de Hurst possa ser mais precisamente estimado, permitindo
que se gere um fGn que represente melhor o ruído real.
Por �m, uma outra medida de comparação dos resultados obtidos pelos métodos é
através de uma medida denominada erro médio quadrático (RMSE - Root Mean Squared
Error), aqui de�nido como
RMSE =1
N
N∑i
√(rki − rki)
2, (4.20)
onde rki é a posição estimada da fonte k durante o quadro i, e rki a sua real posição no
intervalo de tempo. Sendo assim, o valor de RMSE foi calculado para todas as localizações
realizadas neste trabalho, e alguns resultados são mostrados na FIG. 4.6.
Como pode ser notado, em todas as situações apresentadas, o método proposto se
74
(a) Avião + Carro (b) Avião + Balbúrdia (c) Avião + Míssil
(d) Balbúrdia + Carro (e) Balbúrdia + Balbúrdia (f) Balbúrdia + Míssil
(g) Voz + Carro (h) Voz + Balbúrdia (i) Voz + Míssil
(j) Motoserra + Carro (k) Motoserra + Balbúrdia (l) Motoserra + Míssil
FIG. 4.5: Distância de Bhattacharrya entre ML-Energia e ruídos reais(em vermelho) e H-ML-Energia eruídos (linhas azuis), para os valores de SNR entre 0 dB e 20 dB e quadros de 4096 amostras.
aproxima mais dos resultados obtidos quando a distorção é causada por ruídos reais e
correlatados. Nota-se que para a fonte Avião corrompida por ruído Carro, houve grande
distância entre o valor de RMSE do método proposto se comparado com o ML-Energia,
particularmente para os valores de SNR 0 dB e 5 dB. Quando o ruído empregado é o
Veículo Militar, ainda percebe-se uma diferença signi�cativa de RMSE para os valores de
SNR 0 dB e 5 dB. O maior afastasmento entre as curvas do H-ML-Energia e ML-Energia
pode estar relacionado com o fato do ruído ser não-estacionário. Para a distorção causada
pelo Assovio, mais não-estacionário dentre os três apresentados, é notável a queda dos
valores de RMSE para o método proposto, porém, ainda permanecendo mais próximo dos
valores representados pela curva dos ruídos reais do que o método ML-Energia.
Para a fonte Voz, sob distorção gerada pelo ruído Carro, observa-se que o método
H-ML-Energia apresenta um bom resultado entre 0 dB e 10 dB, com valores de RMSE
mais próximos dos obtidos pelos ruídos reais. Analisando o caso em que o ruído é o
Veículo Militar, de maior INS, há uma leve degradação do método, porém o mesmo ainda
permanece mais próximo ao resultado real. Quando a Voz é localizada com o ruído Míssil,
os resultados do método proposto são melhores para os valores de 0 dB e 15 dB.
Da comparação entre os resultados obtidos pelas duas fontes e sabendo que a fonte
Voz é mais não-estacionária que o Avião, pode-se perceber que para os três ruídos, os
75
(a) Avião + Carro (b) Avião + Veículo Militar (c) Avião + Assovio
(d) Voz + Carro (e) Voz + Veículo Militar (f) Voz + Assovio
FIG. 4.6: Comparação entre os métodos ML-Energia, H-ML-Energia e a localização com ruídos reaispara as fontes Avião e Voz. A linha em verde mostra o RMSE obtido quando as fontes são distorcidas porruídos reais. Em vermelho é indicado o RMSE obtido na localização usando o ML-Energia, que consideraruído aditivo sem correlação. O método H-ML-Energia tem seus valores de RMSE representados pelalinha azul.
valores de RMSE são mais elevados se comparados com a localização da fonte Avião,
ou seja, a localização da fonte Voz apresenta mais erros do que a da fonte Avião. Esta
observação indica novamente que o desempenho da localização das fontes acústicas pode
ser relacionado com o INS das mesmas, de forma que quanto mais não-estacionário é um
sinal, maiores são os erros de localização.
4.4 RESUMO
Este Capítulo apresentou o método de localização de fontes baseado na energia do
sinal recebida por sensores. Foi mostrada a técnica ML-Energia, que utiliza-se da má-
xima verosimilhança para estimar a posição de fontes acústicas baseadas nas medições
de energia de uma rede de sensores ad-hoc. Este método considera em sua formulação
que o ruído aditivo que distorce o sistema é descorrelatado, diferindo de ruídos reais, que
possuem correlação. Foi proposto então um método baseado no ML-Energia que leva
em consideração em seu modelo, a correlação entre ruído e fonte de sinal, e que utiliza
o expoente de Hurst para modelar a correlação. Diversas simulações foram realizadas,
onde mostrou-se que o método ML-Energia difere muito em seus resultados quando com-
parado a localização obtida por ruídos reais. Ao �nal do Capítulo, foram apresentados
resultados comparativos entre os métodos H-ML-Energia e o ML-Energia, e através deles,
constatado que o modelo proposto proporciona uma localização de fonte mais próxima da
real, quando os ruídos são correlatados, se comparado com o ML-Energia.
76
5 CONCLUSÃO
Esta Dissertação apresentou duas propostas de métodos de localização de fontes acús-
ticas, com o objetivo de contornar a grande limitação existente nos métodos considerados
como estado da arte, que é a consideração de que o ruído que distorce o sistema é descor-
relatado do sinal da fonte (gaussiano branco). Empregando a técnica de localização de
fontes pela estimação de retardos temporais (TDE), o método SRP-H-PHAT foi proposto,
sendo em sua formulação, a correlação existente entre sinal e ruído modelado por um pro-
cesso fracionário gaussiano com um parâmetro de Hurst apropriado, estimado dos sinais
corrompidos recebidos pelos sensores. Analogia semelhante foi utilizada na proposta do
método H-ML-Energia, que foi proposto segundo o princípio de localização de fontes por
meio da energia acústica.
Para a avaliação dos dois métodos propostos, foram selecionados sinais e ruídos acús-
ticos reais com diferentes índices de não-estacionaridade, além de distintas estruturas de
correlação. Os sinais foram corrompidos por ruídos reais para diversos valores de razão
sinal-ruídos e utilizados para a localização. Em um primeiro momento o método SRP-
PHAT, estado da arte dos métodos baseados em TDE, foi empregado na localização de
fontes corrompidas por ruídos reais. Os resultados obtidos foram comparados com os de
uma localização onde a distorção é causada por um ruído branco. Da análise obtida,
mostrou-se que o SRP-PHAT apresenta degradação de seus resultados de localização
quando a distorção é causada por ruídos reais. Após isto, o método proposto foi empre-
gado na localização das fontes quando corrompidas por ruídos acústicos reais. Através
da comparação das taxas de acerto obtidas, mostrou-se que o método proposto apresenta
resultados mais próximos ao da localização envolvendo ruídos reais do que o SRP-PHAT,
mesmo quando os sinais e ruídos possuem elevado valor de INS.
Estratégia semelhante foi utilizada para a avaliação da proposta H-ML-Energia, onde
de início mostrou-se que os resultados do estado da arte, ML-Energia, sofrem grande
degradação quando as fontes são localizadas na presença de distorções causadas por ruídos
reais. Através do uso da distância de Bhattacharrya, mostrou-se que os resultados obtidos
pelo método proposto se aproximam mais dos reais do que o ML-Energia. Dos resultados
obtidos, veri�cou-se que o H-ML-Energia obteve resultados ainda melhores quando o
77
tamanho de quadro da localização foi aumentado.
As principais contribuições apresentadas nesta dissertação podem ser resumidas da
seguinte forma:
• Proposta de método de localização baseado em TDE que considera que a distorção
é causada por ruídos correlacionados com o sinal da fonte. A proposta utiliza o
expoente de Hurst, através de um processo fGn, para modelar a correlação. Em
comparação com o estado da arte, o método proposto apresentou resultados de
localização mais próximos se comparados com os obtidos com o emprego de ruídos
reais.
• Análise do desempenho do método de localização SRP-PHAT quando a distorção
do sistema é causada por ruídos acústicos reais. Comparando-se os resultados de
localização obtidas pelo método quando as fontes sofrem distorções causadas por
ruídos reais com os obtidos quando a distorção do sistema é representada por um
ruído branco, mostrou-se que existe grande divergência entre os resultados.
• Proposta de método de localização baseado em energia acústica que considera que
a distorção do sistema é causada por ruídos correlacionados com o sinal da fonte.
A proposta utiliza o expoente de Hurst, através de um processo fGn, para modelar
a correlação. Em comparação com o estado da arte, o método proposto apresen-
tou resultados de localização mais próximos se comparados com os obtidos com o
emprego de ruídos reais.
• Análise do desempenho do método de localização ML-Energia quando a distorção
deixa de ser descorrelatada. Os resultados apresentados mostram que há grande
degradação nos resultados de localização quando a distorção do sinal passa a ser
causada por um ruído real. A diferença é ainda mais evidente quando os ruídos são
altamente não-estacionários.
• Constatação de que sinais com maior índice de não-estacionariedade apresentam
mais erros na sua localização do que os de menor INS.
• Constatação de que sinais com valores de INS elevados apresentam uma maior va-
riância de seu parâmetro H, quando o mesmo é analisado por quadros de curta
duração.
78
5.1 SUGESTÕES PARA TRABALHOS FUTUROS
Nesta Seção são destacadas algumas sugestões para trabalhos futuros.
• Investigar as técnicas de realce de voz baseada na decomposição empírica de modos
(EMD - Empirical Mode Decomposition) (HUANG, 1998), com �nalidade de reduzir
a in�uência dos ruídos reais nos resultados de localização de fonte.
• Investigar uma melhoria dos métodos de localização através da inserção do valor do
INS, de tal modo que a localização de fontes de sinais altamente não-estacionários
possam apresentar melhores resultados na localização da fonte.
• Investigar a integração dos métodos de localização de fontes com as técnicas de
auto-posicionamento dos sensores (MAHAJAN, 1999), veri�cando sua viabilidade e
analisando o seu desempenho
5.2 COMENTÁRIOS FINAIS
Esta Dissertação apresentou duas propostas de métodos de localização de fontes acús-
ticas, com o objetivo de contornar a grande limitação existente na literatura, que é a
consideração de que o ruído que distorce o sistema é descorrelatado do sinal da fonte.
Ambos os métodos propostos apresentaram resultados mais próximos aos reais se com-
parados com os respectivos estado da arte, mesmo quando os sinais e ruídos possuem
distintos valores de INS.
79
6 REFERÊNCIAS BIBLIOGRÁFICAS
BARNSLEY, M., DEVANEY, R., MANDELBROT, B., PEITGEN, H., SAUPE, D. eVOSS, R. The Science of Fractal Images. Springer-Verlag, USA, 1988.
BASSEVILLE, M. Distance measures for signal processing and pattern recognition. Sig-nal Processing, 18(4):349�369, 1989.
BHATTACHARYYA, A. On a measure of divergence between two statistical popula-tions de�ned by probability distributions. Bulletin of the Calcutta MathematicalSociety, 35:99�109, 1943.
BORGNAT, P., FLANDRIN, P., HONEINE, P., RICHARD, C. e XIAO, J. Testingstationarity with surrogates: A time-frequency approach. IEEE Transactions onSignal Processing, 58(7):3459�3470, 2010.
BOX, G. e MULLER, M. A note on the generation of random normal deviates. TheAnnals of Mathematical Statistics, 29(2):610�611, 1958.
BRANDSTEIN, M., ADCOCK, J. e SILVERMAN, H. A closed-form location estimatorfor use with room environment microphone arrays. IEEE Transactions on Speech,and Audio Processing, 5(1):45�50, 1997.
CARTER, G. Variance bounds for passively locating an acoustic source with a symmetricline array. The Journal of the Acoustical Society of America, 62(4):922�926,1977.
CARTER, G. Time delay estimation for passive sonar signal processing. IEEE Trans-actions on Acoustics, Speech and Signal Processing, 29(3):463�470, 1981.
CARTER, G., NUTTALL, A. e CABLE, P. The smoothed coherence transform. Pro-ceedings of the IEEE, 61(10):1497�1498, 1973.
CHAN, Y. e HO, K. A simple and e�cient estimator for hyperbolic location. IEEETransactions on Signal Processing, 42(8):1905�1915, 1994.
CHUNG, P. e BOEHME, J. The methodology of the maximum likelihood approach -estimation, detection, and exploration of seismic events. IEEE Signal ProcessingMagazine, 29(3):40�46, 2012.
DAUBECHIES, I. Ten Lectures on Wavelets. SIAM, Philadelphia, 1992.
DIBIASE, J., SILVERMAN, H. e BRANDSTEIN, M. Robust localization in reverberantrooms. Em Microphone Arrays: Signal Processing Techniques and Applica-tions, págs. 155�180. Springer, 2001.
80
DO, H., SILVERMAN, H. e YU, Y. A real-time SRP-PHAT source location implementa-tion using stochastic region contraction (SRC) on a large-aperture microphone array.Proceedings of the IEEE International Conference on Acoustics, Speech,and Signal Processing (ICASSP'07), Honolulu, 2007.
DONOHUE, K., HANNEMANN, J. e DIETZ, H. Performance of phase transform fordetecting sound sources with microphone arrays in reverberant and noisy environments.Signal Processing, 87(7):1677�1691, 2007.
DRANKA, E. e COELHO, R. Métodos PHAT, FLOS-PHAT e ML-energia para localiza-ção de fontes de sinais acústicos impulsivos. Anais do XXXI Simpósio Brasileirode Telecomunicações (SBrT'13), Fortaleza, 2013.
ECKART, C. Optimal recti�er systems for the detection of steady signals. ScrippsInstitution of Oceanography, SIO Ref 52-11, 1952.
FANG, B. Simple solutions for hyperbolic and related position �xes. IEEE Transactionson Aerospace and Electronic Systems, 26(5):748�753, 1990.
GAROFOLO, J., LAMEL, L., FISHER, W., FISCUS, J., PALLETT, D., DAHLGREN,N. e ZUE, V. TIMIT acoustic-phonetic continuous speech corpus. Linguistic DataConsortium, 1993.
GEORGIOU, P., TSAKALIDES, P. e KYRIAKAKIS, C. Alpha-stable modeling of noiseand robust time-delay estimation in the presence of impulsive noise. IEEE Transac-tions on Multimedia, 1(3):291�301, 1999.
HAHN, W. e TRETTER, S. Optimum processing for delay-vector estimation in passivesignal arrays. IEEE Transactions on Information Theory, 19(5):608�614, 1973.
HUANG, N., SHEN, Z., LONG, S., WU, M., SHIH, H., ZHENG, Q., YEN, N., TUNG, C.e LIU, H. The empirical mode decomposition and the hilbert spectrum for nonlinear andnon-stationary time series analysis. Proceedings of the Royal Society of London.Series A: Mathematical, Physical and Engineering Sciences, 454(1971):903�995, 1998.
HURST, H. Long term storage capacity of reservoirs. Transaction of the Americansociety of civil engineer, 116, 1951.
KAILATH, T. The divergence and Bhattacharyya distance measures in signal selection.IEEE Transactions on Communication Technology, 15(1):52�60, 1967.
KINSLER, L. Fundamentals of Acoustics. Wiley, New York, 1982.
KNAPP, C. e CARTER, G. The generalized correlation method for estimation of timedelay. IEEE Transactions on Acoustics, Speech and Signal Processing, 24(4):320�327, 1976.
LI, D. e HU, Y. Energy based collaborative source localization using acoustic micro-sensorarray. EURASIP Applied Signal Processing, 4:321�337, 2003.
81
LI, D., WONG, K., HU, Y. e SAYEED, A. Detection, classi�cation and tracking oftargets in distributed sensor networks. IEEE Signal Processing Magazine, 19(2):17�29, 2002.
LI, D. e HU, Y. Least square solutions of energy based acoustic source localization prob-lems. Proceedings of the International Conference on Parallel Processing(ICPP'04), 2004.
LI, Y., WHITE, M. e FRANKE, S. New fast �eld programs for anisotropic sound prop-agation through an atmosphere with a wind velocity pro�le. The Journal of theAcoustical Society of America, 95(2):718�726, 1994.
MAHAJAN, A. e FIGUEROA, F. An automatic self-installation and calibration methodfor a 3d position sensing system using ultrasonics. Robotics and AutonomousSystems, 28(4):281�294, 1999.
MANDELBROT, B. e NESS, J. Fractional brownian motions, fractional noises and ap-plications. SIAM Review, 10(4), 1968.
MING, J., HAZEN, T., GLASS, J. e REYNOLDS, D. Robust speaker recognition in noisyconditions. IEEE Transactions on Audio, Speech, and Language Processing,15(5):1711�1723, 2007.
MORAGUES, J., VERGARA, L., GOSALBEZ, J., MACHMER, T., SWERDLOW, A. eKROSCHEL, K. Background noise suppression for acoustic localization by means ofan adaptive energy detection approach. Proceedings of the IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP'08), págs.2421�2424, Nevada, 2008.
NIKIAS, C. e SHAO, M. Signal Processing with Alpha-Stable Distributions andApplications. Wiley, New York, 1995.
OMOLOGO, M. e SVAIZER, P. Use of the cross-power-spectrum phase in acoustic eventlocation. IEEE Transactions on Speech and Audio Processing, 5(3):288�292,1997.
PAPOULIS, A. e PILLAI, S. Probability, random variables, and stochastic pro-cesses. McGraw-Hill, 2002.
PATWARI, N., ASH, J., KYPEROUNTAS, S., HERO, A., MOSES, R. e CORREAL, N.Locating the nodes: cooperative localization in wireless sensor networks. IEEE SignalProcessing Magazine, 22(4):54�69, 2005.
PETERSON, J. e KYRIAKAKIS, C. Hybrid algorithm for robust, real-time source lo-calization in reverberant environments. Proceedings of the IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP'05), 4:1053�1056, Philadelphia, 2005.
82
POURMOHAMMAD, A. e AHADI, S. N -dimensional N -microphone sound source lo-calization. EURASIP Journal on Audio, Speech, and Music Processing, 2013(27), 2013.
ROGERS, K. e FINN, A. Three-dimensional uav-based atmospheric tomography. Journalof Atmospheric and Oceanic Technology, 30:336�344, 2012.
ROTH, P. E�ective measurements using digital signal analysis. IEEE Spectrum, 8(4):62�70, 1971.
SAMORODNITSKY, G. e TAQQU, M. Stable Non-Gaussian Random Processes:Stochastic Models and In�nite Variance. Chapman & Hall, London, 1994.
SHENG, X. e HU, Y. Maximum likelihood multiple-source localization using acousticenergy measurements with wireless sensor networks. IEEE Transactions on SignalProcessing, 53(1):44�53, 2005.
VALIN, J., MICHAUD, F., ROUAT, J. e LETOURNEAU, D. Robust sound source local-ization using a microphone array on a mobile robot. Proceedings of the IEEE/RSJInternational Conference on Intelligent Robots and Systems (IROS'03), 2:1228�1233, 2003.
VARGA, A. e STEENEKEN, H. Assessment for automatic speech recognition ii: NOISEX-92: a database and an experiment to study the e�ect of additive noise on speechrecognition systems. Speech Communications, 12(3):247�251, 1993.
VEITCH, D. e ABRY, P. Wavelet analysis of long-range-dependent tra�c. IEEE Trans-actions on Information Theory, 44(1):2�15, 1998.
VELASCO, J., PIZARRO, D. e GUARASA, M. Source localization with acoustic sensorarrays using generative model based �tting with sparse constraints. Sensors, 12(10):13781�13812, 2012.
WANG, H. e CHU, P. Voice source localization for automatic camera pointing systemin videoconferencing. Proceedings of the IEEE International Conference onAcoustics, Speech, and Signal Processing (ICASSP'97), 1(1):187�190, Munich,1997.
WEBSTER, R. Ambient noise statistics. IEEE Transactions on Signal Processing,41(6):2249�2253, 1993.
ZÃO, L. e COELHO, R. Generation of coloured acoustic noise samples with non-gaussiandistribution. IET Signal Processing, 6(7):684�688, 2012.
83