vocale um algoritmo de identificação de intervalos vocálicos no sinal acústico de fala

30
VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Upload: eliana-medina-palhares

Post on 07-Apr-2016

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

VOCALE Um Algoritmo de

Identificação de Intervalos Vocálicos no Sinal Acústico de

Fala

Page 2: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Temos:

Queremos: (0.179 0.301) v (0.301 0.390) c (0.390 0.440) v(0.440 0.498) c(0.498 0.540) v…

Problema

Page 3: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplo de segmentação

Marca

Vowel

Cons.

Vowel.

Page 4: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Conjectura das classes rítmicas Diversos linguistas conjecturaram que as línguas

naturais estavam agrupadas num número finito e pequeno de classes rítmicas ( Lloyd James 1940 , Pike 1945, Abercrombie 1967, etc).

Durante meio século não se conseguiu encontrar evidências acústicas que justificassem essa conjectura.

Essas evidências aparecem nos artigos pioneiros de Ramus, Nespor e Mehler (1999), eles utilizam estatísticas simples de amostras de sinais acústicos produzidos por falantes das diversas línguas consideradas.

Page 5: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Para um conjunto de oito línguas e 20 frases por língua, eles segmentam as frases em intervalos vocálicos e consonantais e definem:

%V = proporção de tempo passado em vogais e

Delta C = desvio padrão dos intervalos consonantais

Ramus, Nespor & Mehler (1999)

Page 6: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Ramus, Nespor & Mehler (1999)

Page 7: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Segmentação manualÉ feita baseada na seguinte

informação:

Gráfico do sinal acústico Gráfico do espectrograma Ouvindo a frase

Page 8: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Dificuldades:

Leva muito tempo Imprecisões Muito difícil de ser reproduzida

Page 9: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Sinal acústico e espectrograma

Page 10: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Espectro de Fourier

Problema: o sinal acústico de fala é não estacionário

Page 11: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Espectrograma

Page 12: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Regiões regulares

Page 13: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Identificando zonas regularesObservação: Em intervalos vocálicos, tipicamente,

pt e pt+1 são “parecidos”. Em intervalos consonantais,

tipicamente, isto não acontece.Exceções: semi-vogais, nasais...

Page 14: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Classificadores(1) Entropia relativa:

F

ft

ttt f

ffh

ppp

1

11 )(

)(log)(

Distância Euclidiana:

F

fttt ffd pp

1

2

1)()(

Page 15: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Classificadores(2) Energia total:

F

ftt fe z

1

)(

Energia na banda [Fa , Fb]:

b

a

ba

F

Fft

FFt fe z )(,

Page 16: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Entropia Relativa (japonês)

Page 17: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Entropia Relativa (Frances)

Page 18: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Energia Total

Page 19: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Energia 1000-5000Hz

Page 20: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplos de Regras de Classificação do P.B.

Entropia relativa baixa Energia total alta Alta energia na banda [1000,5000] hz

alta probabilidade de vogal

Entropia relativa baixa Baixa energia na banda

[1000,5000] hzalta probabilidadede consoante

(nasal) Entropia relativa alta Alta energia na banda

[1000,5000] hzalta probabilidadede consoante

Page 21: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Segmentação: automática vs manual

Page 22: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

ResultadosTaxa de erro: Portugueis Brasileiro: 18% Ingles Britanico: 24%

Consideramos que um erro e produzido quando:

a fronteira não é detectada, ou a fronteira é colocada a uma distância

maior do que 10ms da marcação manualO algoritmo esta disponivel na rede no endereço:www.ime.usp.br/~tycho/tipal/prosody/vocale/

Page 23: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Problemas: Em alguns casos as regras dependem da

língua.

As bandas de freqüências a serem utilizadas dependem do sexo do locutor.

Há critérios linguísticos que não podem ser expressos com regras simples deste tipo. Exemplos: r retroflexo, semi-vogais, etc.

Page 24: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplo: Português e Inglês

Page 25: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Função de sonoridade

Com o objetivo de evitar as ambigüidades na definição de vogal, definimos a função de sonoridade como:

S(t) é uma função com valores perto de 1 nas regiões regulares e perto de 0 nas regiões irregulares.

Page 26: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Uma versão automática de RNM

T

t

tstsT

S1

)1()(1

T

t

tsT

S1

)(1

Page 27: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Resultados com a função de sonoridade

Page 28: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Sonoridade e variação total para cada fonema

Page 29: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Um modelo para a sonoridade

Page 30: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Gráfico de p(0)=P(X(t)=0)