detekcija ključnih besed tekočega govora

12
Detekcija ključnih besed tekočega govora 1 Detekcija ključnih besed tekočega govora ERK 09 dr. Tomaž Rotovnik

Upload: tomaz

Post on 11-Nov-2015

28 views

Category:

Documents


4 download

DESCRIPTION

Zaznava v naprej določenega nabora besed s pomočjo razpoznavanja govora.

TRANSCRIPT

  • Detekcija kljunih besed tekoega govora

    1

    Detekcija kljunih besed tekoega govora

    ERK 09

    dr. Toma Rotovnik

  • Detekcija kljunih besed tekoega govora

    2

    1. Motivacija

    2. Detekcija kljunih besed

    3. Modeliranje

    4. Eksperimenti

    5. Razno

  • Detekcija kljunih besed tekoega govora

    3

    Namen (pomo, ivljenjski standard, anonimnost)

    Uporaba (nadzor, statistika, vzpostavitev komunikacije lovek -stroj)

    Kompleksnost

    Odpornost na motnje

    Storitve

    IVR (VAD, rezervacija vozovnic, vremenska napoved, bannitvo)

    Nadzor pri ljudeh s posebnimi potrebami (GVT)

    Obdelava medijev (press kliping, statistika, indeksiranje)

    1. Motivacija

    Definicija (zaznava v naprej doloenega nabora besed)

    Prva pojavitev 1990, Wilpon, Bell Lab

  • Detekcija kljunih besed tekoega govora

    4

    Izvedba

    - Modeliranje PMM

    - Posprocesiranje razpoznanih besednih mre

    2. Detekcija kljunih besed

    Slabosti in prednosti

    - Raunska kompleksnost

    - viri informacij

    Vrednotenje

    - FOM (tevilo pravilnih zadetkov glede na doloeno obdobje napanih zadetkov)

    - ROC, matrika zamenjav

  • Detekcija kljunih besed tekoega govora

    5

    2. Detekcija kljunih besed

    Legenda

    Logaritemska verjetnost kljune besede i

    Logaritemska verjetnost mail

    Akustini vektor znailk

    Zaporedje stanj v iskalni mrei

    Dolina okvirjev

    ii KB filS S S

    iKBS

    filS

    max log , |

    i

    i

    iS

    KB

    KB

    P O S KBS

    N

    O

    S

    iKBN

    (1)

    (2)

  • Detekcija kljunih besed tekoega govora

    6

    2. Detekcija kljunih besed

    Legenda

    Najveja logaritmina povprena verjetnost

    pojavitve maila j

    Dolina okvirjev v katerih se pojavi mailo j

    (3)

    (4)

    , ,1

    i

    m

    fil j fil jj

    fil

    KB

    S N

    SN

    ,fil jS

    ,fil jN

    ,

    ,

    max log , | ,S

    fil j

    fil j

    P O S fil jS

    N

  • Detekcija kljunih besed tekoega govora

    7

    3. Modeliranje

    1 1

    1 1 1 1 1 1, ,

    argmax | argmax |N N

    N N T N T N

    optw N w N

    w p w x p w p x w

    (Slovnica z odprto zanko)

  • Detekcija kljunih besed tekoega govora

    8

    3. Modeliranje

    Razpoznavanje izoliranih besed (ACC > 95%)

    Razpoznavanje vezanih besed (ACC 95%)

    Razpoznavanje tekoega govora

    Razpoznavanje branega govora (ACC 70%)

    Razpoznavanje spontanega govora (ACC ~ 55%)

    Razpoznavanje kljunih besed (FOM > 80%)

  • Detekcija kljunih besed tekoega govora

    9

    Omogoena zaporedna zaznava kljunih besed

    3. Modeliranje

  • Detekcija kljunih besed tekoega govora

    10

    Kljune besede: kontekstno odvisni (trifoni) in neodvisni modeli (monofoni)

    Maila: kontekstno neodvisni modeli

    4. Eksperimenti

  • Detekcija kljunih besed tekoega govora

    11

    Kljune besede: monofonski modeli

    Kljune besede: trifonski modeli

    4. Eksperimenti

  • Detekcija kljunih besed tekoega govora

    12

    5. Razno

    Vpraanja