d wiĘk w multimediach

55
1 DwiĘk w multimediach Ryszard Gubrynowicz [email protected]. pl Wykład 2

Upload: dori

Post on 13-Jan-2016

62 views

Category:

Documents


3 download

DESCRIPTION

D  wiĘk w multimediach. Ryszard Gubrynowicz [email protected]. Wykład 2. Dźwięki mowy. Badanie dźwięków mowy określonego języka: Jak powstają ? Czym się charakteryzują ? Jakie są między nimi współzależności ? Jakie spełniają funkcje ?. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: D  wiĘk w multimediach

1

D �wiĘk w multimediach

Ryszard [email protected]

Wykład 2

Page 2: D  wiĘk w multimediach

2

Dźwięki mowy• Badanie dźwięków mowy określonego

języka:

• Jak powstają ?

• Czym się charakteryzują ?

• Jakie są między nimi współzależności ?

• Jakie spełniają funkcje ?

Page 3: D  wiĘk w multimediach

3

Dziedziny wiedzy obejmujące Dziedziny wiedzy obejmujące dwustronną komunikację werbalnądwustronną komunikację werbalną

Fonetyka akustyczna

Fonetyka percepcyjna

Fonetyka artykulacyjna

Page 4: D  wiĘk w multimediach

4

Podstawy opisu i klasyfikacji Podstawy opisu i klasyfikacji dźwięków mowydźwięków mowy

Opis artykulacyjny

Opis akustyczny

Opis percepcyjny

Page 5: D  wiĘk w multimediach

5

Fonetyka artykulacyjna

Przedmiotem fonetyki artykulacyjnej jest opisanie mechanizmu powstawania dźwięków mowy w narządzie artykulacyjnym człowieka.

Page 6: D  wiĘk w multimediach

6

Fonetyka akustyczna• Koncentruje się na analizie fizycznych

własności dźwięków mowy promieniowanych wokół osoby mówiącej.

• Badanie dźwięków mowy odbywa się przy zastosowaniu fizycznych metod analizy sygnałów akustycznych.

• Jednocześnie poszukuje powiązań istniejących między czynnością artykulacyjną i wytworzonym sygnałem mowy

Page 7: D  wiĘk w multimediach

7

Fonetyka percepcyjna

• Bada percepcję dźwięków mowy, na poziomie układu centralnego.

• W badaniach stosowane są metody analizy subiektywnej oceny własności sygnałów akustycznych, zrozumiałości mowy itp.

Page 8: D  wiĘk w multimediach

8

Układ akustycznyUkład akustycznyźródło –ośrodek-odbiornikźródło –ośrodek-odbiornik

Page 9: D  wiĘk w multimediach

9

Anatomia i akustyka narządu artykulacyjnego

Page 10: D  wiĘk w multimediach

10

Narząd artykulacyjny człowiekaNarząd artykulacyjny człowieka

Page 11: D  wiĘk w multimediach

11

„Le boulanger dit onze bieres”

Narząd artykulacyjny w akcjiNarząd artykulacyjny w akcji

Page 12: D  wiĘk w multimediach

12

Elementy narządu artykulacyjnego Elementy narządu artykulacyjnego uczestniczące w formowaniu uczestniczące w formowaniu

sygnału mowysygnału mowy

Fałdy głosowe

Podniebienie miękkie

Podniebienie twarde

Język

Zęby

Wargi

Page 13: D  wiĘk w multimediach

13

Źródłem energii promieniowanej podczas mówienia są płuca.

Podobnie jak ma to miejsce w instrumentach muzycznych dętych – źródłem energii niesionej przez dźwięk są płuca osoby grającej

Page 14: D  wiĘk w multimediach

14

Funkcjonalny schemat organu mowyFunkcjonalny schemat organu mowy

Page 15: D  wiĘk w multimediach

15

Układ oddechowy- płucaUkład oddechowy- płuca

Page 16: D  wiĘk w multimediach

16

Układ oddechowy - tchawicaUkład oddechowy - tchawica

Page 17: D  wiĘk w multimediach

17

Cykle oddechowe: proporcje czasoweCykle oddechowe: proporcje czasowe

Max pojemność płuc –ok. 7 litrówPojemność minimalna – 2 litry stale w płucach.Objętość powietrza wymieniana podczas każdego cyklu oddechowego – 0.5 lCzęst. oddychania w stanie spoczynku –12-20 cykli na minutę

Page 18: D  wiĘk w multimediach

18

Przebieg zmian objętości Przebieg zmian objętości powietrza w płucachpowietrza w płucach

VC – pojemność spoczynkowa

Page 19: D  wiĘk w multimediach

19

Źródłem pobudzającym tor Źródłem pobudzającym tor głosowy mogą być:głosowy mogą być:

a) fałdy głosowe – modulują w sposób regularny przepływ powietrza wychodzącego z płuc,

b) szczelina utworzona w torze głosowym - powoduje powstanie zawirowań,

c) przeszkoda (zęby) – j.w.d) krótkotrwały impuls powietrza – powstaje w

wyniku nagłego otwarcia toru głosowego, po chwilowym zwarciu w określonym miejscu toru głosowego.

Page 20: D  wiĘk w multimediach

20

Głośnia+fałdy głosowe+tchawicaGłośnia+fałdy głosowe+tchawicaPrzekrój pionowy

Page 21: D  wiĘk w multimediach

21

Fałdy głosowe – widok z góryFałdy głosowe – widok z góry

Page 22: D  wiĘk w multimediach

22

Fałdy głosowe w akcjiFałdy głosowe w akcji

Faza oddechuFaza oddechu Faza fonacjiFaza fonacji

Page 23: D  wiĘk w multimediach

23

Rozkład ciśnień powietrza w torze głosowym

Page 24: D  wiĘk w multimediach

24

Aerodynamika fałdów głosowychAerodynamika fałdów głosowych

Page 25: D  wiĘk w multimediach

25

Instrumenty muzyczne stroikowe

Harmonijka ustna

Działają na podobnej zasadzie jak fałdy głosowe

Page 26: D  wiĘk w multimediach

26

Przebieg zmian prędkości Przebieg zmian prędkości objętościowej strugi powietrza objętościowej strugi powietrza

u wylotu głośniu wylotu głośni

T0

T0=1/F0

Page 27: D  wiĘk w multimediach

27

Mechaniczny model źródła Mechaniczny model źródła pobudzenia krtaniowegopobudzenia krtaniowego

Model 1-masowy Model 3-masowym – masa fałdów głosowychk – sprężystość fałdówb – stratność w ruchu fałdów

Page 28: D  wiĘk w multimediach

28

Funkcjonalny model źródła krtaniowegoFunkcjonalny model źródła krtaniowego

Page 29: D  wiĘk w multimediach

29

Wzór na częstotliwość drgań Wzór na częstotliwość drgań fałdów głosowychfałdów głosowych

m – masa fałdówK – sztywność (napięcie) fałdówK* - sztywność aerodynamiczna

Page 30: D  wiĘk w multimediach

30

Widmo przebiegu piłokształtnegoWidmo przebiegu piłokształtnegoAproksymacja przebiegu zmian prędkości objętościowej strugi powietrza płynącego przez głośnię

Page 31: D  wiĘk w multimediach

31

Widmo pobudzenia krtaniowegoWidmo pobudzenia krtaniowego

Obwiednia widma opada z częstotliwością –12 dB/okt

Page 32: D  wiĘk w multimediach

32

Zmiana średniej częstotliwości Zmiana średniej częstotliwości tonu krtaniowego w funkcji wietonu krtaniowego w funkcji wieku

Skąd się biorą różnice?

Średnia długość fałdów:noworodki – 5 mmdzieci – 10-13 mmkobiety –11-15 mmmężczyźni – ok. 20 mm

Masa drgających fałdów jest proporcjonalna do ich długości

Page 33: D  wiĘk w multimediach

33

Przebieg zmian częstotliwości F0 Przebieg zmian częstotliwości F0 w zdaniu w zdaniu „„Czy mógłby pan...”Czy mógłby pan...”

Page 34: D  wiĘk w multimediach

34

Przebieg F0 z opisem fonetycznymPrzebieg F0 z opisem fonetycznym

tS I m

ug

bI

p

an

p

S

I sw

a

ts'k o

go

z've

ft o r e k r

a n

o

0

50

100

150

200

250

300

350

400

450

500

0 0.25 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5

Czas [s]

Page 35: D  wiĘk w multimediach

35

Narząd artykulacyjny jako układ Narząd artykulacyjny jako układ akustycznyakustyczny

Jest on swoistego rodzaju układem akustycznym, w którym można wyróżnić dwa podstawowe elementy:a) źródło pobudzająceb) tor głosowy stanowiący w swej istocie rurę o zmiennym przekrojuwypełnioną powietrzem – w torze tym rozchodzi się fala płaska

Page 36: D  wiĘk w multimediach

36

Formowanie sygnału mowyFormowanie sygnału mowy

Page 37: D  wiĘk w multimediach

37

Akustyczny model toru głosowegoAkustyczny model toru głosowego

Page 38: D  wiĘk w multimediach

38

Rezonanse stratnej rury Rezonanse stratnej rury cylindrycznej o długości 17.5 cmcylindrycznej o długości 17.5 cm

formanty

Page 39: D  wiĘk w multimediach

39

Tor głosowy jako rura akustycznaTor głosowy jako rura akustycznao zmiennej konfiguracjio zmiennej konfiguracji

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Czestotliwosc [Hz]

651

14312136

3313

4285

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Czestotliwosc [Hz]

651

1370

2180

34943892

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Poziom [dB]

7121196

26153046

4284

Page 40: D  wiĘk w multimediach

40

Dlaczego rezonanse w modelu 2 - rurowym są inne niż w 1 - segmentowym (sumaryczna

długość w obu przypadkach jest taka sama)?

Page 41: D  wiĘk w multimediach

41

Co się dzieje na granicy 2 segmentów Co się dzieje na granicy 2 segmentów cylindrycznych? (Acylindrycznych? (AkkAAk+1k+1))

Page 42: D  wiĘk w multimediach

42

Jak wygląda przybliżony kształt toru Jak wygląda przybliżony kształt toru głosowego dla /a/ ?głosowego dla /a/ ?

Funkcja powierzchni przekroju toru głosowego An

Page 43: D  wiĘk w multimediach

43

Stosunek powierzchni AStosunek powierzchni Akk/A/Ak+1k+1 a a

charakterystyka częstotliwościowacharakterystyka częstotliwościowa

Nakładanie się fal padających i odbitych o różnym przesunięciu czasowym powoduje ich wielokrotne sumowanie (lub/i odejmowanie). Wielkość (amplituda) fal przenikających i odbitych zależy od stosunku powierzchni Ak/Ak+1. Stosunek tych powierzchni decyduje o charakterystyce częstotliwościowej układu cylindrów

Page 44: D  wiĘk w multimediach

44

Przekroje samogłoskowePrzekroje samogłoskowe

Samogłoska i Samogłoska I Samogłoska e

Samogłoska a Samogłoska o Samogłoska u

Page 45: D  wiĘk w multimediach

45

Miejsce i wysokość artykulacjiMiejsce i wysokość artykulacji

Wysokośćartykulacji

Miejsce artykulacji

długość toru głosowego - 17 cmdługość odcinka cylindrycznego - 1 cm

Page 46: D  wiĘk w multimediach

46

Wpływ położenia zwężenia na Wpływ położenia zwężenia na F1, F2, F3 dla konfiguracji /u/F1, F2, F3 dla konfiguracji /u/

Page 47: D  wiĘk w multimediach

47

Charakterystyka rezonansów Charakterystyka rezonansów modelu samogłoski /a/modelu samogłoski /a/

Page 48: D  wiĘk w multimediach

48

Porównanie widm modelu i Porównanie widm modelu i naturalnej samogłoski /a/naturalnej samogłoski /a/

-40

-35

-30

-25

-20

-15

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

F1

F2

F3

F4

Częstotliwość [kHz]Liczba rezonansów w torze głosowym istotnych dla percepcji dźwięku samogłoskowego jest ograniczona i nie przekracza zazwyczaj 5-7

Page 49: D  wiĘk w multimediach

49

Modelowanie toru głosowego za Modelowanie toru głosowego za pomocą filtrów formantowychpomocą filtrów formantowych

źródło

F1 F3F2

Pojedyncze rezonatory Funkcjapromieniowania

Page 50: D  wiĘk w multimediach

50

Definicja formantuDefinicja formantu

Maksima w charakterystyce częstotliwościowej toru głosowego wpływające na różnicowanie dźwięków mowy danego języka nazywamy formantami. Oznacza to, że nie każde maksimum w widmie danego dźwięku mowy musi być formantem.

Page 51: D  wiĘk w multimediach

51

Trudności w określaniu formantów Trudności w określaniu formantów w sygnałach naturalnychw sygnałach naturalnych

Dwie kolejne samogłoski /a/ w wyrazie „waga” (głos męski, F0=148 Hz)

0

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500

0

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500

0

10

20

30

40

50

60

0 500 1000 1500 2000 2500 3000 3500 4000 4500

Częstotliwość [Hz] Częstotliwość [Hz]

Page 52: D  wiĘk w multimediach

52

Wpływ częstotliwości F0 Wpływ częstotliwości F0 na widmo dźwięku mowyna widmo dźwięku mowy

widmo głosu niskiego

widmo głosu wysokiego

Page 53: D  wiĘk w multimediach

53

Zasadnicze tematyZasadnicze tematy

1) Jakie elementy narządu artykulacyjnego uczestniczą w formowaniu sygnału mowy ?

2) Jaki jest mechanizm działania fałdów głosowych ?

3) Jakie czynniki wpływają na częstotliwość drgań fałdów głosowych ?

4) Jaki jest model formowania dźwięków mowy ?

5) Miejsce i wysokość artykulacji

Page 54: D  wiĘk w multimediach

54

Terminy angielskie

Tchawica - tracheaKrtań – larynxFałdy głosowe – vocal foldsGłośnia - glottisPodniebienie miękkie – soft palatePodniebienie twarde – hard palateWargi – lipsŹródło pobudzenia – excitation sourceCzęstotliwość podstawowa (F0) – fundamental

frequencyTor głosowy – vocal tract

Page 55: D  wiĘk w multimediach

55

Terminy angielskie

• Widmo – spectrum

• Obwiednia widma – spectrum envelope

• Miejsce i wysokość artykulacji – place of articulation, height of articulation

• Formant - formant