polisemija kao neizvesnost znaČenja...
TRANSCRIPT
POLISEMIJA KAO NEIZVESNOST ZNAČENJA REČI
Dušica Filipović Đurđević
Odsek za psihologiju, Univerzitet u Novom SaduLaboratorija za eksperimentalnu psihologiju, Univerzitet u Beogradu
VIŠEZNAČNOST REČI SKORO DA NE PRIMEĆUJEMO...
Engleski jezik: “The spirit is willing, but the flesh is weak.”
Ruski jezik...
Engleski jezik: “The Vodka is good, but the meat is rotten.”
I...VRLO NAM JE KORISNA
Čiko, koliko je sati?....Ne znam, pitaj Zagora.
Muž mi je doneo kokošku i rekao da je spremim za nedelju. Nisam znala šta kokoške nose, pa sam joj obukla ovu haljinicu.
Da li jedete suši?....Ne, uvek jedem s usta!
Da li ste došli s juga?...Ne, došao sam s ladu.
Svi su bili na mojoj strani, zato se čamac i prevrnuo.
DA LI JE HUMOR JEDINA KORIST OD VIŠEZNAČNOSTI?
Da li bi nam život bio jednostavniji da sve reči imaju jedno značenje?
Da li je višeznačnost “korisna” za obradu jezika?
OBLICI VIŠEZNAČNOSTI REČI
Homografija
Cele noći grad je padao na grad.
Homoformija
Dok sam radio, slušao sam radio.
Homonimija
Pop sluša pop.
Polisemija
Kljun se popeo na kljun.
Postoji dodatni kriterijum za razlikovanje.
Značenje jedini kriterijum za razlikovanje.
HOMONIMIJA VS. POLISEMIJA
Homonimija – reči sa više nepovezanih značenjapop – sveštenikpop – vrsta muzike
Polisemija – reči sa više povezanih značenjakljun – deo tela pticekljun – prednji deo aviona, broda, cipele...
Posledica slučaja
Sistematska pojava u jeziku
Usporava obradu
Ubrzava obraduRodd, Gaskell & Marslen-Wilson, 2002Beretta, Fiorentino & Poeppel, 2005
kljun
kljunSve ptice imaju
kljunCipela ima
kljun
NEIZVESNOST ZNAČENJA
?kljun
??
??
?
CILJ(Filipović Đurđević, 2007)
• Višeznačnost → neizvesnost značenja
• kao što su predložili (Gilhooly & Logie, 1980)
NEIZVESNOST ZNAČENJA REČI
Ne postoji → znam tačno
šta će da se desi.
Maksimalna → sve je moguće.
juni →
TRADICIONALNO – BROJ ZNAČENJA
zglobbalkon
NEIZVESNOST ZNAČENJA REČI
TRADICIONALNO – BROJ ZNAČENJA
0
1
2
3
4
5
6
1 2 3 4 5
Broj značenja
RT
Porast u broju značenja praćen kraćim vremenom obrade. Rodd, Gaskell & Marslen-Wilson, 2002Beretta, Fiorentino & Poeppel, 2005
NEIZVESNOST ZNAČENJA REČI
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Ver
ovat
noća
bradazglobbalkon
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Vero
vatn
oća
...0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Vero
vatn
oća
...
NEIZVESNOST ZNAČENJA REČI
Dva izvora neizvesnosti
Više značenja
→ veća neizvesnost
Ujednačenija učestalost upotrebe značenja
→ veća neizvesnost
Ispitano ranijim istraživanjima
Cilj!
KAKO IZMERITI NEIZVESNOST?
Mera neizvesnosti → Entropija
∑=
⋅−=n
iii ppEntropija
0log
verovatnoća
Mera broja značenja→Mera (ne)ujednačenosti verovatnoća značenja→ Redundansa
EntropijaMaxEntropijaredundansa
.1−=
)(log. jaBrojZnacenEntropijaMaks =
CILJ – POKAZATI DA JE:
• Entropija distribucije verovatnoća značenja adekvatan opis višeznačnosti reči.
• Kognitivni sistem osetljiv
• ne samo na broj značenja,
• već i na verovatnoće pojedinih značenja – redundansu.
Za procenuneizvesnosti značenjapotrebno poznavati
verovatnoćeznačenja reči!
REČNIK MATICE SRPSKE• 150 polisemičnih imenica• Raspon značenja: 2 do 18• Raspon frekvencije: 10 do 999
• Prikupljene procene • familijarnosti reči• konkretnosti značenja reči
02468
10
1214161820
1 9 17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145
logpN
(log) Frekvencija
Broj značenja
• Ispitanici navode sva značenja neke reči kojih mogu da sete
• Total meaning metric (Azuma, 1996)
• Klasifikovanje prikupljenih značenja
FORMIRANJE DISTRIBUCIJE VEROVATNOĆA ZNAČENJA
5.710.021govoriti u bradu
(mumlati)
2.180.021simbol za visok pološaj
(zna se ko nosi bradu u ovoj kući)
4.710.042simbol za starost, učenost
(seda brada)
3.240.042osetljivo mesto kod boksera
(staklena brada)
3.940.094deo ploda kukuruza-kukuruzna svila
(kukuruzna brada)
6.940.3918dlake na muškoj bradi
(Obrij tu bradu!)
6.750.2971.990.3918deo lica, deo vilice
(Imam rupicu na bradi)
FamTNHpFBRADA (ispitanici)
EKSPERIMENTI
Da li neizvesnost značenja utiče na vreme prepoznavanja reči?Entropija
Da li ujednačenost verovatnoća značenja utiče na obradu?Redundansa
EKSPERIMENT 1Zadatak leksičke odluke54 studenta prve godine psihologije150 imenica i 150 pseudoimenicaKorelacioni nacrt
Nezavisne varijable:Dužina reči(log) frekvencija lemeFamilijarnost rečiKonkretnost rečiEntropija / Broj značenja i redundansa
Zavisna varijabla:Vreme reakcije
dužina reči: β=0.02, t(7435)=4.41, p<0.0001(log) frekvencija leme: β=-0.024, t(7435)=-8.84, p<0.0001
familijarnost reči: β=-0.052, t(7435)=-6.30, p<0.0001entropija: β=-0.285, t(7435)=-2.97, p<0.01
entropija (nelinearno): β=0.021, t(7435)=3.04, p<0.01familijarnost*entropija: β=0.042, t(7435)=2.79, p<0.01
• Analiza linearnih mešovitih efekata
• Slučajni efektiIspitaniciStimulusi
• Fiksni efekti
EKSPERIMENT 1Entropija
dužina reči: β=0.018, t(7435)=4.08, p<0.0001(log) frekvencija leme: β=-0.025, t(7435)=-9.22, p<0.0001
familijarnost reči: β=-0.053, t(7435)=-6.49, p<0.0001broj značenja: β=-0.002, t(7435)=-2.92, p<0.01
broj značenja (nelinearno): β= 0.0002, t(7435)=2.91, p<0.01redundansa: β=0.241, t(7435)=4.13, p<0.0001
• Analiza linearnih mešovitih efekata
• Slučajni efektiIspitaniciStimulusi
• Fiksni efekti
EKSPERIMENT 1
Broj značenja i redundansa
EKSPERIMENT 2: FAKTORIJALNI NACRT
Nveliko
Nmalo
T velikoT malo
0
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
1 2 3 4 5 6 7 8 9 1 00
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
1 2 3 4 5 6 7 8 9 1 0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
1 2 3 4 5 6 7 8 9 100
0.1
0.2
0.3
0.4
0.5
0.6
0.7
1 2 3 4 5 6 7 8 9 10
EKSPERIMENT 2Zadatak leksičke odluke18 studenata prve godine psihologije60 imenica i 60 pseudoimenicaDva faktora:
broj značenja, dva nivoa (N=9.1, N=16) redundansa, dva nivoa (T=0.10, T=0.21).
Grupe stimulusa ujednačene po: frekvenciji lemefamilijarnostikonkretnostibroju značenja procenjenim na osnovu Rečnika Matice srpske
broju slova.
EKSPERIMENT 2
640
650
660
670
680
690
700
710
720
manji broj značenja veći broj značenja
RT
(ms manja redundansa
veća redundasa
• Analiza linearnih mešovitih efekata
• Slučajni efekti
Ispitanici dužina reči: F(1,987)=13.814, p<0.01(log) frekvencija leme: F(1,987)=6.34, p<0.05
familijarnost: F(1,987)=12.958, p<0.001broj značenja (kategorije): F(1,987)=4.292, p<0.05
redundansa (kategorije): F(1,987)=7.252, p<0.01
• Fiksni efekti
NALAZIEntropija predstavlja kognitivno relevantan opis višeznačnosti reči.
Veća entropija → brža obrada.
Pored broja značenja, na vreme obrade utiče ujednačenost verovatnoća značenja.
Više značenja → brža obrada.Veća ujednačenost značenja → brža obrada.
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
1 2 3 4 5 6 7 8 9 100
0 . 1
0 . 2
0 . 3
0 . 4
0 . 5
0 . 6
0 . 7
1 2 3 4 5 6 7 8 9 1 0
TEZA:Efekat entropije distribucije značenja u skladu sa modelima distribuirane obrade pri prepoznavanju vizuelno prikazanih reči.
(Seidenberg & McClelland, 1989)Povratna aktivacija sa semantičkog nivoa.
(Hino & Lupker, 1996)Polisemija
Veći stepen povratne aktivacije usled smanjene kompeticije između jedinica koje se preklapaju.
(Rueckl, 1995)Ukoliko stepen aktivacije prati učestalost značenja, predviđamo veći stepen povratne aktivacije za reči sa ujednačenim frekvencijama značenja.
Homonimija i ostali oblici višeznačnosti (nepovezana značenja)Sporija obrada usled kompeticije na semantičkom nivouPredikcija – entropija usporava obradu
(Rogers, Marslen-Wilson & Davis, 2008, AMLaP)
PROBLEMI U OPISU VIŠEZNAČNOSTI REČI• Problemi u formiranju distribucije verovatnoća značenja
na osnovu iskaza ispitanika:
• Kategorizacija odgovora?
• Korekcija broja značenja?
• Rečnik, ili ispitanici?
• Nedostatak jedinstvenog opisa za različite vrste višeznačnosti
• Homonimija vs. polisemija- ista mera facilitira/inhibira u zavisnosti od vrste višeznačnosti
POTREBAN ALTERNATIVNI NAČIN OPISIVANJA VIŠEZNAČNOSTI REČI
• Opisati višeznačnost bez oslanjanja na subjektivne procene
• Naći jedinstvenu meru za različite vrste višeznačnosti
(Schütze, 1998)
Moscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)
VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA• Tehnika kvantitativne lingvistike
• Kvantitativni opis značenja reči
• Značenje reči = kontekst u kojem se reč pojavljuje
• Predstavljanje reči preko n-dimenzionog vektora
00000triosobaosnovmuzikarazličitreč
Kontekst
Frekvencija pojavljivanja reči u datom kontekstu
• Prozor širine od 7 reči
• Centralna pozicija ciljna reč
• Registrovanje unapred odabranih kontekst reči u +/- 3 susedne pozicije
00000triosobaosnovmuzikarazličitreč
FORMIRANJE VEKTORA
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00000triosobaosnovmuzikarazličitreč
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više
00000triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00011triosobaosnovmuzikarazličitreč
• Više
00011triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
00121triosobaosnovmuzikarazličitreč
• Više
00121triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
• Više"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
10121triosobaosnovmuzikarazličitreč
• Više
10121triosobaosnovmuzikarazličitreč
"Ako pokušam da ispričam vic, trudeći se pri tom da
reč istovremeno dobije tri različita značenja, to
je kao kad čuješ tri različite muzike u isto vreme,
što je neprijatno i zbunjujuće i nije tako fino kao
beli šum. To je kao kad bi tri osobe pokušale da s
tobom istovremeno razgovaraju o različitim
stvarima. Iz tog razloga u ovoj knjizi nema
viceva."
Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.
VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA• Kosinusna distanca – ugao između vektora odslikava
povezanost značenja reči koje vektori predstavljaju.
vrabac
slavuj
noj
VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA VIŠEZNAČNIH REČI
• Formiranje vektora drugog reda(Schütze, 1998)
• Korak 1: Odvojeni vektori za pojedinačna pojavljivanja reči.
10000tri – 300110tri – 200011tri – 1
osobaosnovmuzikarazličitreč
00011tri – 1osobaosnovmuzikarazličitreč
3010osoba3500osnov0521muzika1024različit0013reč
osobaosnovmuzikarazličitrečKorak 2: Vektori prvog reda za kontekst reči.
00011tri – 1osobaosnovmuzikarazličitreč
3010osoba3500osnov0521muzika1024različit0013reč
osobaosnovmuzikarazličitreč
10334tri – 1osobaosnovmuzikarazličitreč
00011tri – 1osobaosnovmuzikarazličitreč
3010osoba3500osnov0521muzika1024različit0013reč
osobaosnovmuzikarazličitreč
VEKTORI DRUGOG REDA• Korak 3: Suma odgovarajućih vrednosti vektora prvog reda
kontekst reči koje su pronađene u susedstvu datog pojavljivanja ciljne reči.
03010tri – 315225tri – 210334tri – 1
osobaosnovmuzikarazličitreč
VEKTORI DRUGOG REDA• Kosinusna distanca – ugao između vektora odslikava
povezanost pojedinih značenja višeznačnih reči koje vektori predstavljaju.
kljun ptice
kljun – nos/usta
kljun aviona
BIT MODELMoscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)
• Polazna tačka – vektori drugog reda
• Multidimenzionalna distribucija značenja reči u semantičkom prostoru.
• Mešavina multidimenzionalnih Gausovih distribucija
- određivanje parametara bez unapred zadatkog broja komponenti!
• RT u funkciji neizvesnosti, tj. diferencijalne entropije multidimenzionalne distribucije.
KOOPERACIJA VS. KOMPETICIJA
• Diferencijalna entropija pod uticajem:
• Generalne širine distribucije
LAKOĆA AKTIVACIJE
• Broj komponenti (broj Gausovih distribucija)• Relativne verovatnoće komponenti• Stepen razdvojenosti komponenti
KOMPETICIJA
EGE VS. NEGENTROPIJA
• EGE(Entropy of Equivalent Gaussian)
• Generalna varijabilnost konteksta• Odslikava kooperaciju povezanih
značenja – polisemija.
• Negentropija• EGE – diferencijalna entropija• Odslikava kompeticiju između
nepovezanih značenja – homonimija.
• Analiza vremena reakcije na skupu homonima i polisemičnih reči(Moscoso del Prado Martìn et al., submitted)
NAŠ CILJ
• Efekat EGE i
• odsustvo efekta negentropije
• na skupu isključivo polisemičnih imenica srpskog jezika
• koristeći metod kojeg su predložili Moscoso del Prado Martìnet al. (submitted).
FORMIRANJE KONTINUALNE DISTRIBUCIJE VEROVATNOĆA• Metod predložen od Moscoso del Prado Martìn et al. (submitted)
• Vektori drugog reda za 150 polisemičnih imenica srpskog jezika(Schütze, 1998)
• 1000 najfrekventnijih reči kao kontekst reči
• Ebart – elektronska baza od 70 miliona reči
• 130 reči sa više od 500 pojavljivanja
• Procenjeni EGE i Negentropija.
EKSPERIMENT
Zadatak vizuelne leksičke odluke 54 studenta prve godine psihologije150 imenica i 150 pseudoimenicaKorelacioni nacrt
Nezavisne varijable:Dužina reči(log) frekvencija lemeFamilijarnost rečiKonkretnost rečiEGE / Negentropija
Zavisna varijabla:Vreme reakcije
REZULTATI• Analiza linearnih mešovitih efekata (RT VLD Eksperiment)
• Slučajni efekti: IspitaniciStimulusi (reči)
• Fiksni efekti: Dužina reči: β=0.014, t(1,6573)=3.07, p<0.01
(log) Frekvencija leme: β=-0.022, t(1,6573)=-7.89, p<0.001 Familijarnost reči: β=-0.043, t(1,6573)=-5.13, p<0.001
Entropija (diskretno p): β=-0.014, t(1,6573)=-2.62, p<0.01 Entropija (diskretno p), nelinearno: β=0.027, t(1,6573)=3.78, p<0.001
Entropija (diskretno p) * Familijarnost reči: β=0.051, t(1,6573)=2.70, p<0.01 EGE: β=-0.084, t(1,6573)=-2.46, p=0.01
EFEKAT EGE
REZIME
Polisemija može da se opiše kao varijabilnost konteksta u kojima se reč javlja.
EGE (Entropy of Equivalent Gaussian) ubrzava obradu polisemičnih reči.
Negentropija multidimenzionalne distribucije kontekstualnih vektora nema uticaja na obradu.
ZAKLJUČCI
Polisemične reči se brže obrađuju zahvaljujući:
širokoj aktivaciji u semantičkom prostoru i
smanjenoj kompeticiji između komponenti distribucije koje se preklapaju u velikoj meri.
Potvrđene predikcije izvedene iz modela koji
ne zahteva subjektivne procene ispitanika
pruža jedinstven okvir za različite vrste višeznačnosti
KOGNITIVNI SISTEM VOLI REČI KOJE MOGU DA SE KORISTE U RAZLIČITIM POVEZANIM ZNAČENJIMA
HVALA
Ovo istraživanje sufinansirano je od strane Ministarstva nauke i zaštite životne sredine Republike Srbije
(projekat broj: 149039D).