die akustische analyse von sprachlauten. die interpretation von spektrogrammen. jonathan harrington...
TRANSCRIPT
![Page 1: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/1.jpg)
Die akustische Analyse von Sprachlauten.
Die Interpretation von Spektrogrammen.
Jonathan Harrington
IPDS, Kiel.
![Page 2: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/2.jpg)
s t a m
Zeit
1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung (hier 30 ms) ist die Dauer des Signals die Fourier-analysiert wird
30 ms
Vom Zeitsignal zum SpektrumA
mp
litude
Frequenz
Spektrum
2. Fourier Analyse
![Page 3: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/3.jpg)
30 ms
Ca. 2.5 Perioden in 30 ms
Grundfrequenz 1/0.012 Hz 85 Hz
Periodendauer, Grundfrequenz, Harmonischen
21e Harmonische 85 x 21 = 1770 Hz
Spektrum
Zeitsignal
Periodendauer 30/2.5 ms 12 ms = 0.012 s
![Page 4: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/4.jpg)
Frequenz- und Zeitauflösung
Die Frequenzauflösung (Hz) ist ca. im ungekehrten Verhältnis zur Dauer des Zeitfensters (s) oder zur Zeitauflösung.
Zeitauflösung = 30 ms = 30/1000 sFrequenzauflösung = 1000/30 Hz
= 33.3 Hz
30 ms
Das bedeutet: Je breiter die Zeitauflösung, umso schmaler die Frequenzauflösung und umgekehrt
![Page 5: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/5.jpg)
Im Spektrum werden Frequenzen nur differenziert, wenn deren Abstand größer als die Frequenzauflösung ist:
Frequenzen 100, 110, 120 HzAbstand = 10 Hz
Zeitsignal
110 120100
Spektrum
Undifferenzierte Frequenzen
Frequenzen 100, 150, 200 HzAbstand = 50 Hz
100 150 200
Differenzierte Frequenzen
30 ms
Fourier-Analyse
Frequenzauflösing = 33.3 Hz
![Page 6: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/6.jpg)
Breite Zeitauflösung: 30 msschmale Frequenzauflösung: 33.3 Hz(Schmalbandanalyse)
Die Harmonischen sind nicht mehr sichtbar, und die Formanten treten dadurch deutlicher hervor
Fourier-Analyse
F1 F2F3
Schmale Zeitauflösung: 3 ms Breite Frequenzauflösung: 333 Hz(Breitbandanalyse)
3 ms30 ms
Hier sind die Harmonischen sichtbar, da die Grundfrequenz und daher der Abstand zwischen
Harmonischen ca. 85 Hz
Fourier-Analyse
F1 F2 F3
![Page 7: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/7.jpg)
Spektrale Änderungen in der Zeit
Wenn wir feststellen wollen, wie sich das Spektrum mit der Zeit ändert, müssen Fourier-Analysen zu sämtlichen Zeitpunkten berechnet werden
Anfang vom [a] Mitte vom [a] Ende vom [a]
![Page 8: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/8.jpg)
‘Wasserfall Abbildung
F2
F2
F2
F2
Anfang vom [a]
Mitte vom [a]
Ende vom [a]
![Page 9: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/9.jpg)
Wasserfall-Abbildung zum Spektrogramm
In einem Spektrogramm wird die Amplitude in Dunkelheit umgesetzt – je dunkler umso höher die Amplitude
F1F2
F3
Tal
Frequenz (Hz)
Zeit
![Page 10: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/10.jpg)
In einem Breitbandspektrogramm ist:
Die Harmonischen: nicht sichtbar(da f0 < 300 Hz)
Die Stimmlippenschließung:sichtbar(Da T > 3 ms)
Für dieses Signal:f0 ca. 85 Hz
Periodendauer, T, 1/85 s 12 ms
Die Frequenzauflösung mindestens 300 Hz
Die Zeitauflösung ist daher1/300 3 ms
![Page 11: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/11.jpg)
BreitbandspektrogrammFrequenzauflösung = 333.3 Hz, Zeitauflösung = 3 ms
Stimmlippenschließung
Jede Schließung erzeugt eine gerade Linie im Breitband-Spektrogramm und ist mit einem Höhepunkt im Zeitsignal synchronisiert
![Page 12: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/12.jpg)
SchmalbandspektrogrammFrequenzauflösung ist meistens 45 Hz
Harmonische sind sichtbar, da f0 85 Hz
Zeitauflösung = 1/45 22 msStimmlippenschließungen sind nicht sichtbar, da die Periodendauer 12 ms
GrundfrequenzF1
F2
F35e Harmonische
2e Harmonische
![Page 13: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/13.jpg)
Schmalbandspektrogramm und die Tonhöhe
5e Harmonische 450 Hz, daher f0 90 Hz
Mit einem SB-Spektrogramm kann man oft an Hand der höheren Harmonischen • Die Änderungen der Tonhöhe sehen• Die Grundfrequenz einschätzen
Tonhöhe steigt fällt
![Page 14: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/14.jpg)
Ein Spektrum wird durch die Anwendung einer Fourier-Analyse auf einen Teil oder ein Fenster vom einem Zeitsignal angewendet
Die Frequenzauflösung ist im ungekehrten Verhältnis zur Dauer oder Zeitauflösung dieses Fensters: je schmaler das Fenster, umso grober (breiter) die Frequenzauflösung
In einem Spektrogramm werden Spektra in regelmäßigen Zeitabständen berechnet: die Amplitude entspricht der Dunkelheit
Zusammenfassung
![Page 15: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/15.jpg)
Um Harmonischen im Spektrum/Spektrogramm zu sehen, muss die Grundfrequenz größer als die Frequenzauflösung sein. Daher ist ein Schmalbandspektrogramm (Frequenzauflösung typischerweise 45 Hz) für die Analyse von Harmonischen geeignet
Um Stimmlippen-Schließungen im Spektrogramm zu sehen, muss die Periodendauer größer als die Zeitlauflösung sein. Dafür ist ein Breitbandspektrogramm (Zeitauflösung ca. 3 ms, Frequenzauflösung über 300 Hz) geeignet.
Zusammenfassung (fortgesetzt)
![Page 16: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/16.jpg)
7. Der Sinusoid links wird mit der Resonanzkurve rechts gefiltert. Erzeugen Sie eine Abbildung des Spektrums der Ausgabe.
0 5 10 15 20 25
01
23
4
Zeit (Sekunden)
Am
plit
ud
e-4
-20
24
0 0.2 0.6 0.8 1.00.4
10 Perioden in einer Sekunde.
Frequenz = 10 Hz
0 5 10 15 20 25
01
23
4
Frequenz (Hz)
Am
plit
ude
![Page 17: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/17.jpg)
Luftdruck-maximum
Atmosphärischer Luftdruck
15 cm
15 cm
Wellenlänge ()
Resonanz für eine Wellenlänge von: = (4 x 15)/3 cm = 20 cm
15 cm = ¾
Und für eine Frequenz von f = c/ = 35000/20 = 1750 Hz
8. Die typische Länge von einem Vokaltrakt einer Frau ist 15 cm. Berechnen Sie den zweiten Resonanz eines [] Vokals an Hand eines Rohres von der selben Länge.
![Page 18: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/18.jpg)
9. Beim Tief-Tauchen besteht die Luft oft aus einer Mischung von Sauerstoff und Helium, wodurch die Schallgeschwindigkeit erheblich höher wird. Welcher Einfluss übt dies auf die Resonanzen vom Vokaltrakt des Tauchers aus?
Frequenz = Schallgeschwindigkeit / Wellenlänge
f = c /
Je grösser cumso größer c/ also umso höher die Frequenz
![Page 19: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/19.jpg)
Normal
Einatmung von Heliox(c ist höher)
Einatmung von Schwefel-Hexafluorid (c ist niedriger)
My name is Yelda
Beispiele: John Ohala, Phonetics Laboratory San Francisco
2 kHz
2 kHz
2 kHz
![Page 20: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/20.jpg)
10. Wenn Vokale gerundet werden, wird der Vokaltrakt länger. Welcher Einfluss übt dies auf die Resonanzen aus?
Je länger der Vokaltrakt, umso grösser wird (die Wellenlänge)
f = c /
f (die Frequenz der Resonanz) wird kleiner wenn grösser wird, da:
Daher führt die Lippenrundung zu einer Senkung der Formantfrequenzen
![Page 21: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/21.jpg)
11. Berechnen Sie den zweiten Formant für die Frau in 8. bei einer Grundfrequenz von (i) 200 Hz (ii) 280 Hz.
Welches Vielfach von 200 Hz liegt 1750 Hz am nächsten?
Antwort = die 9e Harmonische = 1800 Hz = F2
Für F0 = 280 Hz,
Antwort = die 6e Harmonische = 1680 Hz
![Page 22: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel](https://reader035.vdocuments.site/reader035/viewer/2022062417/55204d6449795902118ba2ef/html5/thumbnails/22.jpg)
Bitte Fragen 12-28 (Seiten 12-16) zum nächsten Mal beantworten.