tratamiento digital de voz prof. luis a. hernández gómez dpto. señales, sistemas y...
TRANSCRIPT
![Page 1: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/1.jpg)
Tratamiento Digital de Voz
Prof. Luis A. Hernández Gómez
Dpto. Señales, Sistemas y Dpto. Señales, Sistemas y RadiocomunicacionesRadiocomunicaciones
![Page 2: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/2.jpg)
Tratamiento Digital de VozTratamiento Digital de Voz
Tema 1: Producción de sonidos y fonética Mecanismo de producción y tipos de sonidos Fonética (nociones) Modelos Prácticos
Tema 2: El oído y la percepción de vozTema 3: Técnicas de Análisis Temas 4 a 7 Aplicaciones de TDV
Codificación de Voz Reconocimiento de HablaReconocimiento de LocutoresConversión Texto - HablaSistemas Conversacionales
![Page 3: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/3.jpg)
Mecanismo de Producción y Tipos de Mecanismo de Producción y Tipos de SonidosSonidos
Procesado eficiente explotar características de la voz
Características de la voz proceso de producción
![Page 4: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/4.jpg)
Mecanismo de ProducciónMecanismo de Producción
![Page 5: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/5.jpg)
VibraciónVibración
Flujo de aireFlujo de aire
Mecanismo de ProducciónMecanismo de Producción
![Page 6: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/6.jpg)
Tipos de SonidosTipos de Sonidos
Segmentos sonoros : vibración de las cuerdas vocales
Articulación de /o/ Articulación de /u/
Ejemplos: las vocales
![Page 7: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/7.jpg)
Segmentos fricativos : estrechamiento y turbulencia
Articulación de /s/ Articulación de /f/
Ejemplos: sonidos [s], [f]
Tipos de SonidosTipos de Sonidos
![Page 8: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/8.jpg)
Segmentos oclusivos : cierre total, explosión
Articulación de /p/ Art. /b/ oclusiva
Ejemplos: sonidos [p], [b]
Tipos de SonidosTipos de Sonidos
![Page 9: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/9.jpg)
Estudios de Lingüística Española Volumen 4 (1999)
ISSN: 1139-8736
Depósito Legal: B-39200-99 LA TRANSCRIPCIÓN FONÉTICA AUTOMÁTICA DEL DICCIONARIO ELECTRÓNICO DE FORMAS SIMPLES FLEXIVAS DEL ESPAÑOL:
ESTUDIO FONOLÓGICO EN EL LÉXICO Antonio Ríos Mestre
http://elies.rediris.es/elies4/
Fonética (nociones)Fonética (nociones)
![Page 10: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/10.jpg)
Universidad Politécnica de Cataluña Universidad del País VascoUniversidad Politécnica de Cataluña
Fonética articulatoria
FricativasAproximantes
VibrantesLaterales
Sono
rida
d
VocalesSi
No
Nasales
Oclusivas
Oclusivas Fricativas
Africadas
Oclusión
No Total Parcial
![Page 11: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/11.jpg)
Universidad Politécnica de Cataluña Universidad del País VascoUniversidad Politécnica de Cataluña
Fonética articulatoria
labios: [p], [b], [m]
dientes: [t], [d]
alvéolos: [n], [s]
paladar: [J], [L]
velo: [k], [g], [x]
Puntos de articulación
![Page 12: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/12.jpg)
Universidad Politécnica de Cataluña Universidad del País VascoUniversidad Politécnica de Cataluña
Fonética articulatoria
cada uno de los sonidos propios de una lengua
Puntos de articulación
Alófono
![Page 13: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/13.jpg)
Universidad Politécnica de Cataluña Universidad del País VascoUniversidad Politécnica de Cataluña
Fonética articulatoria
conjunto de alófonos con el mismo valor fonológico en una lengua
Puntos de articulación
Alófono
Fonema
![Page 14: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/14.jpg)
Universidad Politécnica de Cataluña Universidad del País VascoUniversidad Politécnica de Cataluña
Fonética articulatoria
Puntos de articulación
Alófono
Fonema
Variabilidad
contexto coarticulación
prosodia
locutor factores individuales
... y sociolingüísticos
![Page 15: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/15.jpg)
Fonética (nociones)Fonética (nociones)
Problemas del repertorio de fonemas del Español Antonio Ríos Mestre (capítulo 4)
Referencia: http://liceu.uab.es/~joaquim/home.htmlJoaquim LlisterriJoaquim Llisterri
Grup de FonèticaSeminari de Filologia i Informàtica
Departament de Filologia Espanyola,Universitat Autònoma de Barcelona
![Page 16: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/16.jpg)
Modelo y Parametrización de la VozModelo y Parametrización de la Voz
ModeloFísico
ModeloFísico
Modelo Espectr
al
Modelo Espectr
al
Modelo Excitación- Filtro
Modelo Excitación- Filtro
• control flexible/intuitivo• expresividad• CO-ARTICULACIÓN fácil
ProsContras
• análisis/re-síntesis fácil
• dificultad analisis/re-síntesis • medidas invasivas
• menos expresivo• CO-ARTICULACIÓN difícil
![Page 17: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/17.jpg)
Modelo y Parametrización de la VozModelo y Parametrización de la Voz
CavidadNasal
CavidadOral
Cavidadfaríngea
lengua
Velo
Cuerdasvocales
Fuerza muscular
SalidaSonido
oral
SalidaSonidoNasal
Pulmones
![Page 18: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/18.jpg)
Fase Abierta Fase Cerrada
Periodo de apertura Periodo decierre
![Page 19: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/19.jpg)
Modelo y Parametrización de la VozModelo y Parametrización de la Voz
FuenteGlotal
TractoVocal(Filtro)
Radiación11 z
Ruido de aspiración
Interacción tracto-fuente: La forma de onda glotal depende, en general, de la configuración del tracto vocal
Aproximación: Despreciar la interacción fuente-tracto ya que la impedancia glotal es muy ata casi siempre.
![Page 20: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/20.jpg)
Modelo y Parametrización de la VozModelo y Parametrización de la Voz
FuenteGlotal
TractoVocal(Filtro)
Radiación11 z
Ruido de aspiración
Forma deOndaGlotal
)1( 1 zRuido de aspiración
TractoVocal(Filtro)
“Excitación glotal”
Señal deVoz
![Page 21: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/21.jpg)
Modelo del Tracto VocalModelo del Tracto Vocal Se modela como un filtro de todo-polos (Filtro IIR) El tracto vocal se representa como una serie de tubos uniformes y sin pérdidas concatenados. Se supone que el sonido se propaga como una onda plana a lo largo del tracto vocal.
AlipA1 ANA2
Terminación enlos labios
Glotis
Ug
-1
Ulip
1-kN
-kN
![Page 22: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/22.jpg)
Modelo del Tracto VocalModelo del Tracto Vocal
1
1
mm
mmm AA
AAk -km km
1-km
1+km
Am Am+1CoeficienteDe reflexión
• Si el periodo de muestreo es T = 2 , puede demostrarse que la función de transferencia del tracto vocal es un filtro todo-polos de orden N• Los coeficientes autoregresivos del filtro que modela el tracto vocal pueden convertirse en los km mediante el métodp de Durbin.
Um
Um
+
- Um+1
Um+1+
-
: tiempo de propagación de la onda sonora a través de un tubo. N : número de tubo desde la glotis hasta los labios
![Page 23: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/23.jpg)
Modelo del Tracto VocalModelo del Tracto Vocal
1----------------------
1 - aiz-i
e(n)Señal deexcitación
s(n)Señal de Voz
![Page 24: Tratamiento Digital de Voz Prof. Luis A. Hernández Gómez Dpto. Señales, Sistemas y Radiocomunicaciones](https://reader036.vdocuments.site/reader036/viewer/2022062623/5528bde6497959977d8fd75c/html5/thumbnails/24.jpg)
Análisis Visual de la Señal de VozAnálisis Visual de la Señal de Voz
Herramientas: Generales de Audio (tipo Cool Edit) Específicas de Voz
Herramientas Específicas de Libre Distribución: Snack & WaveSurfer (KTH) http://www.speech.kth.se/software/(Referencias Joaquim Llisterri) ESPS (HTK) SFS