detekcija ključnih besed tekočega govora
DESCRIPTION
Zaznava v naprej določenega nabora besed s pomočjo razpoznavanja govora.TRANSCRIPT
-
Detekcija kljunih besed tekoega govora
1
Detekcija kljunih besed tekoega govora
ERK 09
dr. Toma Rotovnik
-
Detekcija kljunih besed tekoega govora
2
1. Motivacija
2. Detekcija kljunih besed
3. Modeliranje
4. Eksperimenti
5. Razno
-
Detekcija kljunih besed tekoega govora
3
Namen (pomo, ivljenjski standard, anonimnost)
Uporaba (nadzor, statistika, vzpostavitev komunikacije lovek -stroj)
Kompleksnost
Odpornost na motnje
Storitve
IVR (VAD, rezervacija vozovnic, vremenska napoved, bannitvo)
Nadzor pri ljudeh s posebnimi potrebami (GVT)
Obdelava medijev (press kliping, statistika, indeksiranje)
1. Motivacija
Definicija (zaznava v naprej doloenega nabora besed)
Prva pojavitev 1990, Wilpon, Bell Lab
-
Detekcija kljunih besed tekoega govora
4
Izvedba
- Modeliranje PMM
- Posprocesiranje razpoznanih besednih mre
2. Detekcija kljunih besed
Slabosti in prednosti
- Raunska kompleksnost
- viri informacij
Vrednotenje
- FOM (tevilo pravilnih zadetkov glede na doloeno obdobje napanih zadetkov)
- ROC, matrika zamenjav
-
Detekcija kljunih besed tekoega govora
5
2. Detekcija kljunih besed
Legenda
Logaritemska verjetnost kljune besede i
Logaritemska verjetnost mail
Akustini vektor znailk
Zaporedje stanj v iskalni mrei
Dolina okvirjev
ii KB filS S S
iKBS
filS
max log , |
i
i
iS
KB
KB
P O S KBS
N
O
S
iKBN
(1)
(2)
-
Detekcija kljunih besed tekoega govora
6
2. Detekcija kljunih besed
Legenda
Najveja logaritmina povprena verjetnost
pojavitve maila j
Dolina okvirjev v katerih se pojavi mailo j
(3)
(4)
, ,1
i
m
fil j fil jj
fil
KB
S N
SN
,fil jS
,fil jN
,
,
max log , | ,S
fil j
fil j
P O S fil jS
N
-
Detekcija kljunih besed tekoega govora
7
3. Modeliranje
1 1
1 1 1 1 1 1, ,
argmax | argmax |N N
N N T N T N
optw N w N
w p w x p w p x w
(Slovnica z odprto zanko)
-
Detekcija kljunih besed tekoega govora
8
3. Modeliranje
Razpoznavanje izoliranih besed (ACC > 95%)
Razpoznavanje vezanih besed (ACC 95%)
Razpoznavanje tekoega govora
Razpoznavanje branega govora (ACC 70%)
Razpoznavanje spontanega govora (ACC ~ 55%)
Razpoznavanje kljunih besed (FOM > 80%)
-
Detekcija kljunih besed tekoega govora
9
Omogoena zaporedna zaznava kljunih besed
3. Modeliranje
-
Detekcija kljunih besed tekoega govora
10
Kljune besede: kontekstno odvisni (trifoni) in neodvisni modeli (monofoni)
Maila: kontekstno neodvisni modeli
4. Eksperimenti
-
Detekcija kljunih besed tekoega govora
11
Kljune besede: monofonski modeli
Kljune besede: trifonski modeli
4. Eksperimenti
-
Detekcija kljunih besed tekoega govora
12
5. Razno
Vpraanja