meko racunarstvo - seminar ski rad

Upload: stevan-panic

Post on 08-Jul-2015

517 views

Category:

Documents


0 download

TRANSCRIPT

Univerzitet u Novom Sadu Tehniki fakultet Mihajlo Pupin Zrenjanin

Seminarski radPredmet: Meko Raunarstvo Tema: Neuronske mree i njihova primena u tehnologiji prepoznavanja govora

Profesor: prof. Dr. Petar Hotomski Asistent: Dr. Brtka Vladimir

Student: Stojan Miloev Br. Indeksa: 16/06-02 Smer: Profesor Informatike

Zrenjanin, 2011

SadrajSADRAJ..........................................................................................2 UVOD.............................................................................................3 .................3 NEURON..........................................................................................4 2. FAZI NEURON..............................................................................6 4. UENJE........................................................................................7 5. PRIMENE FAZI NEURONSKIH MREA KAO ADAPTIVNIH SISTEMA......9 6. PRIMENA NEURONSKIH MREA U TEHNOLOGIJI PREPOZNAVANJA GOVORA........................................................................................10 7.STATIKI PRISTUP.......................................................................12 8.DINAMIKI PRISTUP.....................................................................13 9.ZAKLJUAK..................................................................................14 10.LITERATURA.............................................................................15

UvodNeuronska mrea je jedan oblik implementacije sistema vetake inteligencije koji predstavlja sistem koji se sastoji od odreenog broja meusobno povezanih procesora ili vorova, ili procesnih elemenata koje nazivamo vetakim neuronima. Telo neurona naziva se vor ili jedinica. Svaki od neurona ima lokalnu memoriju u kojoj pamti podatke koje obraduje. Podaci koji se obrauju su lokalni podaci kao i oni koji se primaju preko veze. Podaci koji se ovim kanalima razmenjuju su obino numeriki. Arhitektura neuronske mree predstavlja specifino povezivanje neurona u jednu celinu. Struktura neuronske mree se razlikuje po broju slojeva. Prvi sloj se naziva ulazni, a poslednji izlazni, dok se slojevi izmedju nazivaju skriveni slojevi. Najee ih ima 3. Prvi sloj tj. ulazni je jedini sloj koji prima podatke iz spoljanje sredine, sledei sloj (skriveni) prosleuje relevantne podatke do treeg (izlaznog) sloja. Na izlazu treeg sloja dobijamo konaan rezultat. Sloenije neuronske mree imaju vie skrivenih slojeva. Slojevi su meusobno potpuno povezani. Slojevi meusobno komuniciraju tako to se izlaz svakog neurona iz prethodnog sloja povezuje sa ulazima svih neurona narednog sloja.

NeuronU inenjerstvu se ve ustalio izaraz neuron za jednostavan element procesiranja koji izvrava jednostavnu matematiku funkciju. Saglasno tome mree koje se sastoje iz jednog broja meusobno povezanih neurona nazivaju se neuronskim mreama.

Slika 1Na slici 1 prikazan je neuron. Ulazne vrednosti u neuron su prikazane sa gde je n ukupan broj ulaza u neuron. Svaka ulazna vrednost se prvo pomnoi sa teinskim koeficijentom , gde je i redni broj neurona u neuronskoj mrei. : Ovako pomnoene se potom sabiraju i dobija se vrednost

Zatim se ova vrednost koristi kao ulaz u nelinearnu funkciju , koja zavisi od parametra prikazanog na slici. Ova zavisnost je najee takva da se oduzima od ,i potom se njihova razlika koristi kao ulaz u nelinearnu funkciju . Tako se dobija vrednost datog izraza i-tog neurona.

Parametar se naziva parametar aktivacije.

Slika 2Nelinearna funkcija moe da ima razliite oblike. Neke od korienih funkcija su prikazane na slici 2. Funkcija (a) radi tako da, ako je ulaz p vei od , izlaz iz ove funkcije je jednak jedinici, a inae je jedanak nuli. Funkcija (b) radi tako da, ako je ulaz p vei od , izlaz iz ove funkcije je jednak jedinici, a inae je jednak minus jedan. Zbog toga to od parametara zavisi izlaz nelinearne funkcije, i to tako znaajno da se vrednost izlaza menja drastino u zavisnosti od ovog parametra, se naziva pragom aktivacije. Drugim reima kaemo da je neuron aktivan kada je njegova izlazna vrednost jednaka jedinici. Kao deo neuronske mree, neuron ui tako to menja vrednosti teinskih faktora .

2. Fazi neuronPostoji nekoliko tipova fazi neurona. Ovde emo predstaviti dva. Fazi neuron se u odnosu na neuron razlikuje u sledeem: Ulazi u neuron su fazi brojevi Izlaz iz fazi neurona je fazi broj Teinski koeficijenti su fazi brojevi Ulazi sa teinskim koeficijentima se ne sabiraju, ve se nad njima vri druga operacija agregacije

(a)

(b)Slika 3

Dva tipa fazi neurona prikazana su na slici 3. Tip neurona (a) predstavlja prirodno proirenje fazi zakljuivanja u delu preduslova pravila. Tip neurona (b) je potpuno proirenje klasinog neurona. Tip neurona (a) se sastoji iz dva dela: prvi koji ini ulazni stepen, gde se izraunava setpen saglasnosti izmeu ulaznih vrednosti i funkcija pripadnosti . U drugom stepenu se ove ulazne vrednosti kombinuju da bi se dobila izlazna vrednost . Ovaj tip neurona zadovoljava posledji uslov a to je da se ulazi pomnoeni sa teinskim faktorima uvek ne sabiraju ve se na njima vri neka druga operacija agregacije. Ovaj tip neurona se koristi kao ulazni sloj u vie fazi neuronskih mrea. Tip neurona (b) je proirenje neurona za sluaj kada su vrednsoti ulaza, parametara i izlaza fazi brojevi. Da bismo formirali takav fazi neuron, potrebno je da na navedene izraze za obian neuron primenimo princip proirenja. Dakle vrednosti , , sa slike su sada fazi brojevi, i svi izrazi vae i dalje, s tim to se na njih primenjuje princip proirenja. Ovaj tip fazi neurona zadovoljava prva tri uslova: da su ulaz, izlaz i teinski koeficijenti neurona fazi brojevi.

4. UenjeNeuron ui tako to menja vrednost svojih parametara . Fazi neuron ui na slan nain. Ovaj neuron ui tako to menja parametre fazi funkcije pripadnosti koje odgovaraju delu preduslova fazi pravila. Naime u prvom delu ovog fazi neurona nalaze se funkcije pripadnosti. Za predstavljanje funkcija pripadnosti koriste se parametri. Na primer, za trougaonu simetrinu funkciju pripadnosti se koriste njen poloaj i njena irina (slika 4). Na osnovu izraunate greke na eljenu vrednost izalza iz datog neurona vri se izmena parametara funkcije. Pri tome moe da se menja poloaj funkcije pripadnosti to se postie promenom vrednosti parametra , navrednost , ili irina .

funkcije pripadnosti, to se postie promenom vrednosti parametara

na vrednost

Slika 4

5. Primene fazi neuronskih mrea kao adaptivnih sistemaPri razvoju fazi sistema ima nekoliko zadataka koji se uspeno mogu obaviti pomou neuronskih mrea. Pri izradi fazi sistema baziranih na znanju strunjaka javljaju se sledei problemi: 1. esto je teko definisati sloene i neprecizne koncepte koji se koriste u fazi sistemima 2. Pri podeavanju parametara fazi pravila u cilju samanjenja greke upravljanja teko je definisati optu proceduru pomou koje se ovo podeavanje moe izvesti. 3. Zbog obrade nepreciznosti, u odnosu na klasine metode, ponekad su raunski zahtevi pri fazi zakljuivanju takvi da utiu na opadanje preformansi sistema U poslednjih nekoliko godina navedena tri problema se sa dosta uspeha reavaju primenom neuronskih mrea. Neuronska mrea je mrea sainjena od velikog broja jednostavnih i meusobno povezanih elemenata. Svaki od meusobno povezanih jednostavnih elemenata vri jednostavnu funkciju, ali zbog povezanosti sa velikim brojem elemenata u mrei izlaz svakog elemnta utie na ulaz drugih elemenata. Na taj nain se moe postii da kao celina obavlja prilino sloenu obradu. Pojave koje su jasno izdvojile neuronske mree u odnosu na ostale raunarske sisteme su: Masivna paralelna obrada informacija Mogunost uenja i generelizacije Mogunost pamenja i podseanja

Ono to je naroito znaajno za sprezanje neuronskih mrea i fazi sistema je mogunost neuronskih mrea da menjaju svoju strukturu i parametre na osnovu ulaznih vrednosti jednom reju da ue na osnovu primera. Sa osobinom fazi sistema da opisuju poajve korienjem kvalitativnih, oveku bliskih pojmova, ova osobina prilagoavanja neuronskh mrea ini veoma ozbiljne temelje novog pogleda na raanurasku inteligenciju. Neuronska mrea ui tako to joj se predstavljaju uzorci. Po zavretku procesa uenja, neuronska mrea aproksimira nelinearnu funkciju. Znaajna osobina generalizacije omoguava da neuronska mrea moe da proizvede odziv i za uzorke koji joj u procesu uenja nisu predstavljeni. Neuronska mrea omoguava aproksimaciju i generalizaciju proizvoljne nelinearne funkcije. Matematiki izaraz te funkcije je u optem sluaju nepoznat.

6. Primena neuronskih mrea u tehnologiji prepoznavanja govoraGovor je prirodni nain komunikacije za ljude. Mi saznamo sve relevantne vetine komunikacije govorom tokom ranog detinjstva bez uputstava, i nastavljamo da se oslanjamo na komunikaciju govorom tokom ostatka naeg ivota. Ona nam dolazi tako prirodno da mi ne shvatamo koliko je kompleksan pojam fenomena govora. Ljudski vokalni trakt je bioloki organ nelinearnih karakteristika iji rad nije samo pod svesnom kontrolom nego i pod uticajem faktora u rasponu od pola do emotivnog stanja. Kao rezultat toga vokalizacija moe znatno da varira u smislu njihovog akcenta, izgovora, artikulacije, hrapavosti, terena, jaine zvuka i brzine, osim toga tokom prenosa na govor moe biti dalje iskrivljen pozadinskom bukom i odjecima. Svi ovi izvori varijabilnosti ine da prepoznavanje govora predstavlja veoma sloen problem. Poznato je da ljudski mozak radi radikalno drugaije od konvencionalne raunarske paradigme. Dok konvencionalni raunari koriste veoma brz i sloen oricesir sa eksplicitnim programskim instrukcijama i adresabilnom memorijom, ljudski mozak koristi masovnu paralelnu konekciju sporih i jednostavnih elemenata za obradu (neurona) gusto povezanih sinapsama ija je snaga modifikovna iskustvom direktno, podravajui integraciju vie ogranienja i pruanje distribuirane forme asocijativne memorije. Pitanje trenutnog stanja tehnologije prepoznavanja glasa je kompleksno pitanje, jer tanost sistema zavisi od uslova pod kojima se ocenjuje. Pod dovoljno kontrolisanim uslovima skoro bilo koji sistem moe postii ljudsku tanost ali je mnogo tee postii zadovoljavajuu preciznost pod normalnim uslovima. Uslovi evaluacije, i samim tim tanost bilo kog sistema, moe da se razlikuje po sledeim dimenzijama:

Veliina renikao

Stopa greke raste sa veliinom renika, ali i renik sa relativno malo rei moe biti teak za razumevanje ako sadri nerazumljive i kompleksne rei tako da se stopa greke od 7% smatra dobrom za ovakve renike.

Zavisnost i nezavisnost sistema od govornikao

Po definiciji zavisni sistem je predvien za korienje od strane jednog korisnika a nezavisni je predvien za korenje od strane bilo kog korisnika.

Izolovani, isprekidani i kontiunalni govoro

Izolovani govor predstavlja pojedinani rei, isprekidani govor predstavljaju reenice gde su rei razdvojene pauzama (vetakim utanjem) i kontiunalni govor koji predstavlja normalno izgovaranje reenica.

Zadatak i jezik ogranienja

o

ak i sa fiksnim renikom preformanse e varirati sa prirodom ogranienja sekvenci rei koje su dozvoljene tokom prepoznavanja. Ogranienja su esto predstavljena gramatikom koja idealno filtrira nerazumljive reenice tako da prepoznava govora vrednuje samo razumljive reenice.

itanje i spontani govoro

Sistemi mogu biti ocenjeni govorom koji je unapred pripremljen i zapisan ili spontanim govorom. Ocenjivanje spontanim govorom je daleko tee jer ima tendenciju da sadri disfunkcionalne rei kao to su uh i um,pogrean start, kaljanje , smeh i tavie renik je u sutini neogranien tako da sistem mora da bude u stanju da se inteligentno snalazi sa nepoznatim reima

Nepovoljni uslovio

Uinak sistema takoe moe da degradira niz nepovljnih uslova. Ovo ukljuuje buku, akustine poremeaje (eho, akustika prostorije), razliite vrste mikrofona, ogranien propusni opseg frekvencija i menjanje naina govora.

U cilju procene i uporeivanja razliitih sistema u okviru dobro definisanih uslova, stvoren je broj standardizovanih baza podataka sa odreenim karakteristikama. Jedna od baza koja je u iroj upotrebi je DARPA baza za upravljanje resursima. Ona ima velik renik (1000 rei), bazu podataka kontiunalnog govora nezavistan od govornika koja sadri 4000 trenanih reenica u oblasti pomorskog upravljanja resursima, proitane iz unapred pripremljene skripte u optimalnim uslovima. Pod optimalnim uslovima preformanse preoznavanja rei dostiu 97%. Poto je prepoznavanje govora u osnovi problem prepoznavanja obrazaca, i zbog toga to su neuronske mree dobre u prepoznavanju ablona mnogi istrivai su pokuali da upotrebe neuronske mree u tehnologiji prepoznavanja govora. Najraniji pokuaju su ukljiivali veoma jednostavne zadatke, npr. Klasifikaciju govornih segmenata kao ujni ili neujni.Uspeh u ovim eksperimentima podstie istrivae da preu na kalsifikaciju foneme, ovaj zadatak je postao poligon dokazivanja za neuronske mree jer su brzo pokazale svetski priznate rezultate. Postoje dva osnovna pristupa u klasifikaciji govora korienjem neuronske mree:statiki i dinamiki, kao to je ilustrovano na slici 1.6.

Slika 5 U statikoj klasifikaciji, neuronska mrea vidi sve unose govora odjednom u ini jednu odluku. Nasuprot tome u dinamikoj klasifikaciji neuronska mrea vidi samo mali deo govora i ovaj deo prelazi preko ulaznog govora dok mrea pravi niz lokalnih odluka, koje moraju kasnije biti integrisane u globalnu odluku. Statika klasifikacija se pokazala kao dobro reenje za prepoznavanje fonema ali loe na nivou rei ili reenice dok se dinamika klasifikacija pokazala bolje. Bilo koji pristup moe koristiti rekurzivne veze iako rekurziju ee nalazimo u dinamikom pristupu.Fonemska klasifikacija moe da se obalja sa velikom tanosu pomou bilo statikog ili dinamikog pristupa.

7.Statiki pristupJednostavan ali elegantan eksperiment je izveden od strane Huang-a i Lippmann-a (1988), poakzuje daneuronske mree mogu da formiraju sloene povrine reenja iz govornih podataka. Oni su upotrebili vie slojne perceptrone sa samo 2 ulaza, 50 skrivenih jedinica i 10 izlaza za kolekciju samoglasnika proizvedenih od strane ena, mukaraca i dece, koristei prva dva formata samoglasnika kao zastupnika ulaznog govora. Posle 50.000 iteracija treninga mrea je proizvela region odluka. Ovaj region odluka je skoro optimalan nalik na region odluka koji bi se nacrtao rukom preputajui tanost klasifikacije uporediv sa vie konvencionalnim algoritmima, kao to su K-najblii sused i Gausova klasifikacija.

Slika 6 U sloenijem eksperimentu Elman i Zisper (1987) su obuili mreu da klasifikuje samoglasnike a/i/u i suglsnike b/g/d koji se javljaju u izgovaranju ba/bi/bu, da/di/du i ga/gi/gu. Njihov ulaz na mrei se sastojao od 16 spektralinh koeficijenata od preko 20 frejmova, ovo je unoeno u skrivani sloj sa izmeu 2 i 6 jedinica to je vodilo do 3 izlaza za klasifikaciju samoglasnika ili suglasnika. Ova mrea je postigla stopu greke od oko 0.5%. analiza srivene jedinica su pokazala da one imaju tendenciju da budu karakteristike detektora, diskriminiui izmeu vanih klasa zvukova kao to su suglasnici u odnosu na samoglasnike.

8.Dinamiki pristupWaibel (1987-1989) je pokzao odline rezultate fonetsku klasifikaciju koristei neuronsku mreu sa vremenskim kanjenjem TDNN (Time Delay Neural Network). Ova arhitektura ima samo 3 i 5 kanjenja na ulaz i skriveni sloj a konaan broj se izraunava kroz integrisanje preko 9 frejmova fonetske aktivacije u drugom skrivenom sloju. Dizajn TDDN-a je atraktivan iz vie razloga: njegova kompaktna struktura ekonomie na teinama i tera mreu na razvijanje optih karakteristika detektora; njegova hijerarhija odlaganja optimizuje ovih karakteristike detektora poveavajui njihov opseg na svakom sloju, a njegova vremenska inetgracija u izlaznom sloju ini pomeranje mree invarijantno(tj. Mrea je neosetljiva na tano pozicioniranje govora). TDNN je obuena na 2000 uzoraka b/d/g fonema izvedenih iz baze podataka od 5260 japanskih rei. TDNN je postigla stopu greke od 1.5% u poreenju sa 6.5% postignute jednostavnim prepozanvaem govora.

Slika 7

9.ZakljuakNeuronske mree nam omoguavaju obradu velike kolicine informacija koristei velik broj paralelno povezanih jednostavnih elemenata od kojih je sainjena, i samim tim je sposobna za reavanje krajnje sloenih problema. Ova sposobnost joj omoguava iroku upotebu u svim sferama tehnike i ivota. U ovom seminarskom radu je kao primer uzeta njena primena tehnologiji prepoznavanja govora gde je pokazala odline rezultate, mnogo bolje od klasinih raunarskih sistema. Sa obzirom na to da je prepoznavanje govora u osnovi prepoznavanje obrazaca, a neuronske mree su dobre u prepoznavanju ablona nije ni udo to su u nainjenim eksperimentima pokazale tako zavidne rezultate. injenica da neuronske mree daju odline rezultate iako ova tehnologija nije upotpunosti istraena, kao i sposobnost neuronskih mrea da ue na iskustvu garantuje njenu dalju upotrebu u sve veem broju tehnologija.

10.Literatura1. Dr. Pero Subai,Fazi logika i neuronske mree, Tehnika knjiga, Beograd 1997 2. Dr Petar Hotomski, Sistemi vetake inteligencije, TF 'Mihajlo Pupin', Zrenjanin 3. http://www.learnartificialneuralnetworks.com/