ses tanima

54

Upload: erhan-cetin

Post on 26-Jun-2015

1.545 views

Category:

Documents


5 download

DESCRIPTION

Ses Tanıma ile Hazırladığım bir Slaytç

TRANSCRIPT

Page 1: Ses tanima
Page 2: Ses tanima
Page 3: Ses tanima
Page 4: Ses tanima

Öznitelik ÇıkarımıFrekans Spektrumu Katsayıları

Özellik vektörleri

Page 5: Ses tanima

Akustik İncelemeGizli DurumAkustik İnceleme Benzerlikleri

Page 6: Ses tanima

“Six”

Page 7: Ses tanima
Page 8: Ses tanima

Konuşma birimleri inşa etmeNitelik benzerlikleri üretmeÖrnekleme oranı kritiktir! WSJ vs. WSJ_8kTIDIGITS, RM1, AN4, HUB4

Page 9: Ses tanima

Kelime Benzerlikleri

Page 10: Ses tanima

ARPA format Example:

1-grams:-3.7839 board -0.1552-2.5998 bottom -0.3207-3.7839 bunch -0.21742-grams:-0.7782 as the -0.2717-0.4771 at all 0.0000-0.7782 at the -0.29153-grams:-2.4450 in the lowest -0.5211 in the middle -2.4450 in the on

Page 11: Ses tanima

public <basicCmd> = <startPolite> <command> <endPolite>;

public <startPolite> = (please | kindly | could you ) *;

public <endPolite> = [ please | thanks | thank you ];

<command> = <action> <object>;

<action> = (open | close | delete | move); <object> = [the | a] (window | file | menu);

Page 12: Ses tanima

Ses birimleri için kelime haritaları

Page 13: Ses tanima

cmudict.06d ‘da bir örnek

POULTICE P OW L T AH SPOULTICES P OW L T AH S IH ZPOULTON P AW L T AH NPOULTRY P OW L T R IYPOUNCE P AW N SPOUNCED P AW N S TPOUNCEY P AW N S IYPOUNCING P AW N S IH NGPOUNCY P UW NG K IY

Page 14: Ses tanima

HMM arama grafları inşa etme : Akustik model İstatistik dil modeli Gramer Sözlük

Page 15: Ses tanima
Page 16: Ses tanima
Page 17: Ses tanima

Statik ve dinamik olarak inşa edilebilir

Page 18: Ses tanima

Düz (FlatLinguist)Dinamik düz (DynamicFlatLinguist)Sözcük Ağaçları (LexTreeLinguist)

Page 19: Ses tanima

Arama Grafları için harita özellik vektörleri

Page 20: Ses tanima

En uyumlu için grafı arama

P(sequence of feature vectors| word/phone)

aka. P(O|W)

-> Giriş nasıl kelimelere benzetilir.

Page 21: Ses tanima

F ay ay ay ay v v v v vF f ay ay ay ay v v v vF f f ay ay ay ay v v vF f f f ay ay ay ay v vF f f f ay ay ay ay ay vF f f f f ay ay ay ay vF f f f f f ay ay ay v…

Page 22: Ses tanima

TimeO1 O2 O3

Page 23: Ses tanima

Algoritma kullanarak düşük değerler ayıklanır

Page 24: Ses tanima

Kelimeler!

Page 25: Ses tanima

En çok kullanılan ölçüReferans cümle içinden

dönüştürürken değişiklikler

Page 26: Ses tanima

Referans: “This is a reference sentence.”

Sonuç: “This is neuroscience.”2 Silme 1 Değiştirme Gerekli

Page 27: Ses tanima

Referans: “This is a reference sentence.”

Sonuç: “This is neuroscience.”

WER100deletions substitutions insertions

Length

Page 28: Ses tanima

Referans: “This is a reference sentence.”

Sonuç: “This is neuroscience.”

D S D

WER10021 05

1003

560%

Page 29: Ses tanima
Page 30: Ses tanima
Page 31: Ses tanima
Page 32: Ses tanima
Page 33: Ses tanima
Page 34: Ses tanima
Page 35: Ses tanima
Page 36: Ses tanima
Page 37: Ses tanima
Page 38: Ses tanima
Page 39: Ses tanima
Page 40: Ses tanima

Çoklu konuşma engellenirseTek kişi konuşurken

Page 41: Ses tanima

*Eğer girişte gürültü var ise hata oranı 2 katına çıkar

Page 42: Ses tanima

Diğer Değişkenler:-Sürekli vs. Yalıtılmış-Konuşma vs. Okuma-Lehçe

Page 43: Ses tanima

Sorular?

Page 44: Ses tanima

TimeO1 O2 O3

Page 45: Ses tanima

TimeO1 O2 O3

P(ay | f) *P(O2|ay)

P(f|f) * P(O2 | f)

Page 46: Ses tanima

TimeO1 O2 O3

P (O1) * P(ay | f) *P(O2|ay)

Page 47: Ses tanima

TimeO1 O2 O3

Page 48: Ses tanima

Sphinx4 Sık Sorulan Sorular:http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html

Page 49: Ses tanima

Soru. Arama grafı her tanıma sonucu için mi yoksa bir tanıma uygulaması için mi üretilir?

Cevap. Hangi Dilbilimini kullandığımıza göre değişir. Düz (The flat linguist) arama grafı oluşturur ve onu hafızada saklar. Küçük kelimeler için kullanılır. Sözcük Ağaçı

(The lexTreeLinguist) dinamik olarak arama graflarını düzenler.Böylece büyük kelimelere ulaşım kolaylaşır.

Page 50: Ses tanima

Soru.Ayrıştırıcı hangi algoritmayı kullanır?

Cevap. Sphinx4 mutlak ve bağıl sinyal ayrıştırma

kullanır.

Page 51: Ses tanima

Mutlak Sinyal Genişliği - # aktif arama yolu

<property name="absoluteBeamWidth" value="5000"/>

Bağıl Sinyal Genişliği – Eşik olasılığı <property name="relativeBeamWidth" value="1E-

120"/> Kelime Ekleme Olasılığı – <property name="wordInsertionProbability"

value="0.7"/> Dil Ağırlık– Dil modeli puanları artırır. <property name="languageWeight" value="10.5"/>

Page 52: Ses tanima

Sessizlik girişi Olasılığı <property name="silenceInsertionProbability"

value=".1"/>Dolgu girişi olasılığı <property name="fillerInsertionProbability"

value="1E-10"/>

Page 53: Ses tanima

Python”da Java örneği:

import subprocess

subprocess.call(["java", "-mx1000m", "-jar","/Users/Username/sphinx4/bin/Transcriber.jar”)

Page 54: Ses tanima

Speech and Language Processing 2nd Ed.Daniel Jurafsky and James MartinPearson, 2009

Artificial Intelligence 6th Ed.George LugerAddison Wesley, 2009

Sphinx Whitepaperhttp://cmusphinx.sourceforge.net/sphinx4/#whitepaper

Sphinx Forumhttps://sourceforge.net/projects/cmusphinx/forums