tri modela za opis jezika · gramatika engleskog jezika. nadalje, posebna podklasa takvih procesa,...

22
Tri modela za opis jezika * Noam Chomsky Odjel za suvremene jezike i istraˇ zivaˇ cki laboratorij elektronike Tehnoloˇ ski institut u Massachusettsu Cambridge, Massachusetts Saˇ zetak U ovom radu istraˇ zujemo nekoliko koncepata lingvistiˇ ckih struktura koje bi mo- gle opisivati jednostavne i “otkrivaju´ ce” gramatike s mogu´ cnoˇ cu generiranja svih reˇ cenica engleskog jezika, i samo njih. Otkrivamo da niti jedan konaˇ can Markov- ljev proces, koji generira znakove prijelazima me du stanjima, ne moˇ ze posluˇ ziti kao gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene- riraju statistiˇ cke aproksimacije n-tog stupnja, ne pribliˇ zavaju se izlazu gramatike engleskog jezika s pove´ canjem stupnja n. Formaliziramo ideju “frazne strukture” i pokazujemo da nam ona omogu´ cava opisivanje jezika mo´ cnijom metodom, ali onom koja je i dalje predstavljiva elementarnom vrstom procesa s konaˇ cnim brojem sta- nja. Ipak, navedenu metodu je mogu´ ce uspjeˇ sno primijeniti samo na malom broju jednostavnih reˇ cenica. Istraˇ zujemo formalna svojstva skupa gramatiˇ ckih transfor- macija, koje preoblikuju reˇ cenice s fraznim strukturama u nove reˇ cenice s izvedenim fraznim strukturama, pokazuju´ ci da su transformacijske gramatike procesi iste one elementarne vrste kao i gramatike fraznih struktura. Engleska gramatika je opse- gom pojednostavljena ako je opis fraznih struktura ograniˇ cen na jezgru jednostavnih reˇ cenica iz kojih su sve ostale reˇ cenice sastavljene ponavljanjem transformacija. Po- kazujemo da ovaj pogled na lingvistiˇ cku strukturu daje odre deni uvid u koriˇ stenje i razumijevanje jezika. 1 Uvod Dva su srediˇ snja problema u deskriptivnom prouˇ cavanju jezika. Prvi izazov za lin- gviste/ice je otkrivanje jednostavnih i “otkrivaju´ cih” gramatika za prirodne jezike. Is- todobno, prouˇ cavanjem svojstava uspjeˇ snih gramatika te otkrivanjem temeljnih poza- dinskih koncepata, lingvisti/ce se nadaju rjeˇ senju izazova pronalaska op´ ce teorije jeziˇ cne strukture. Neke znaˇ cajke ova dva povezana izazova istraˇ zit ´ cemo u ovom radu. Gramatika jezika se moˇ ze promatrati kao teorija strukture tog istog jezika. Znans- tvene teorije temelje se na konaˇ cnom skupu opaˇ zanja i, postavljanjem op´ cih zakona izreˇ cenih odre denim hipotetskim konstruktima, one pokuˇ savaju objasniti ta opaˇ zanja, * Chomsky, Noam. “Three models for the description of language.” IRE Transactions on information theory 2.3 (1956): 113-124. Preveo Klemo Vladimir, Sveuˇ ciliˇ ste u Zagrebu, Fakultet elektrotehnike i raˇ cunarstva, Zavod za elek- troniku, mikroelektroniku, raˇ cunalne i inteligentne sustave. 1

Upload: others

Post on 19-Feb-2020

21 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Tri modela za opis jezika∗

Noam Chomsky†

Odjel za suvremene jezike i istrazivacki laboratorij elektronike

Tehnoloski institut u Massachusettsu

Cambridge, Massachusetts

Sazetak

U ovom radu istrazujemo nekoliko koncepata lingvistickih struktura koje bi mo-gle opisivati jednostavne i “otkrivajuce” gramatike s mogucnoscu generiranja svihrecenica engleskog jezika, i samo njih. Otkrivamo da niti jedan konacan Markov-ljev proces, koji generira znakove prijelazima medu stanjima, ne moze posluziti kaogramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisticke aproksimacije n-tog stupnja, ne priblizavaju se izlazu gramatikeengleskog jezika s povecanjem stupnja n. Formaliziramo ideju “frazne strukture” ipokazujemo da nam ona omogucava opisivanje jezika mocnijom metodom, ali onomkoja je i dalje predstavljiva elementarnom vrstom procesa s konacnim brojem sta-nja. Ipak, navedenu metodu je moguce uspjesno primijeniti samo na malom brojujednostavnih recenica. Istrazujemo formalna svojstva skupa gramatickih transfor-macija, koje preoblikuju recenice s fraznim strukturama u nove recenice s izvedenimfraznim strukturama, pokazujuci da su transformacijske gramatike procesi iste oneelementarne vrste kao i gramatike fraznih struktura. Engleska gramatika je opse-gom pojednostavljena ako je opis fraznih struktura ogranicen na jezgru jednostavnihrecenica iz kojih su sve ostale recenice sastavljene ponavljanjem transformacija. Po-kazujemo da ovaj pogled na lingvisticku strukturu daje odredeni uvid u koristenje irazumijevanje jezika.

1 Uvod

Dva su sredisnja problema u deskriptivnom proucavanju jezika. Prvi izazov za lin-gviste/ice je otkrivanje jednostavnih i “otkrivajucih” gramatika za prirodne jezike. Is-todobno, proucavanjem svojstava uspjesnih gramatika te otkrivanjem temeljnih poza-dinskih koncepata, lingvisti/ce se nadaju rjesenju izazova pronalaska opce teorije jezicnestrukture. Neke znacajke ova dva povezana izazova istrazit cemo u ovom radu.

Gramatika jezika se moze promatrati kao teorija strukture tog istog jezika. Znans-tvene teorije temelje se na konacnom skupu opazanja i, postavljanjem opcih zakonaizrecenih odredenim hipotetskim konstruktima, one pokusavaju objasniti ta opazanja,

∗Chomsky, Noam. “Three models for the description of language.” IRE Transactions on informationtheory 2.3 (1956): 113-124.†Preveo Klemo Vladimir, Sveuciliste u Zagrebu, Fakultet elektrotehnike i racunarstva, Zavod za elek-

troniku, mikroelektroniku, racunalne i inteligentne sustave.

1

Page 2: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

pokazati njihovo medudjelovanje te predvidjeti neke nove pojave. Matematicka teorijaima dodatno svojstvo u kojem predvidanja slijede strogo iz same teorije. Slicno, grama-tika se temelji na konacnom skupu promatranih recenica (lingvisticki korpus) i ona pro-jicira taj skup na beskonacan skup recenica postavljanjem opcih “zakona” (gramatickihpravila) oblikovanih hipotetskim konstruktima jezika koji se promatra, kao sto su fo-nemi, rijeci, fraze, i slicni. Valjano oblikovana gramatika treba nejednoznacno odreditiskup gramaticnih recenica nekog jezika.

Opcenita lingvisticka teorija moze se promatrati kao meta-teorija koja razmatra pro-blem odabira takve gramatike, za svaki pojedini jezik, na temelju konacnog korpusarecenica. Ona ce razmotriti i pokusati tumaciti odnos skupa gramaticnih recenica iskupa promatranih recenica. Drugim rijecima, lingvisticka teorija pokusava objasnitigovornikovu/cinu mogucnost konstrukcije i razumijevanja novih recenica, te odbacivanjadrugih novih recenica, kao negramaticnih, na temelju ogranicenog lingvistickog iskustva.

Pretpostavimo da za mnoge jezike postoje odredeni jasni primjeri gramaticnih i ne-gramaticnih recenica, npr. (1) i (2), respektivno, za engleski jezik.

(1) John ate a sandwich.(2) Sandwich a ate John.

U ovom slucaju, mozemo ispitati osnovanost predlozene lingvisticke teorije utvrdiva-njem, za svaki jezik zasebno, jesu li navedeni jasni primjeri pokriveni gramatikama kons-truiranima u skladu s teorijom. Primjerice, ako veliki korpus engleskog jezika ne sadrzava(1) ili (2), pitamo se da li gramatika utvrdena za taj korpus generira novi korpus kojice sadrzavati (1) i koji nece sadrzavati (2). Iako ovakvi primjeri mogu pruziti samo slabdokaz osnovanosti gramatike za neki jezik u izolaciji, oni pruzaju snazan dokaz za bilokoju lingvisticku teoriju i skup gramatika koje slijede iz nje, buduci da inzistiramo dasu osnovni primjeri pokriveni na strog i unaprijed odreden nacin. Moguce je napravitiodredene korake prema konstrukciji operacijske karakterizacije “gramaticne recenice” izkoje ce slijediti jasni primjeri potrebni za postavljanje zadatka lingvistike. Primjerice,uocimo da ce engleski govornik recenicu (1) procitati uobicajenom intonacijom, dok cerecenica (2) biti procitana silaznom intonacijom za svaku rijec, kao i svaki drugi niznepovezanih rijeci. Moguce je opisati i druge slicne razlikovne kriterije.

Prije no sto se mozemo nadati zadovoljavajucem objasnjenju opce veze izmedu opaze-nih recenica i gramaticnih recenica, moramo nauciti puno vise o formalnim svojstvimanavedenih skupina recenica. Ogranicit cemo se na engleski jezik i pretpostavit cemointuitivno poznavanje engleskih recenica i nerecenica. Potom, pitamo se kakva vrstalingvisticke teorije je potrebna kao osnova za englesku gramatiku koja ce opisivati skupengleskih recenica na zanimljiv i zadovoljavajuci nacin.

Pocetak lingvisticke analize nekog jezika cini konacan sustav reprezentacije recenicatog jezika. Pretpostavit cemo da je ovaj korak proveden, a jezik cemo promatrati samou fonemskoj ili abecednoj transkripciji. Jezikom cemo nazvati konacan ili beskonacanskup recenica, gdje je svaka recenica konacne duljine, te su sve recenice konstruiraneiz konacne abecede znakova. Ako je A abeceda, onda nizom iz A nazivamo sve onosto je nastalo nadovezivanjem znakova iz A. Gramatika nekog jezika L jest uredaj koji

2

Page 3: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

proizvodi one, i samo one, nizove znakova koji su recenice jezika L.

Bez obzira kako u konacnici odlucimo izgraditi lingvisticku teoriju, sigurno cemo zah-tijevati da je gramatika bilo kojeg jezika konacna. Zakljucujemo da lingvisticka teorijamoze iznijeti samo prebrojiv skup gramatika; bezbroj drugih jezika nije moguce opisatizamisljenim lingvistickim strukturama neke teorije. S obzirom na predlozenu teorijulingvisticke strukture, prikladno je postaviti sljedece pitanje:

(3) Postoje li zanimljivi jezici koji nisu obuhvaceni predlozenim opisom?

Konkretno, pitat cemo se je li engleski jedan od takvih jezika. Ako jest, onda jepredlozena teorija lingvisticke strukture neprikladna. Ako je odgovor na (3) nijecan,mozemo nastaviti s pitanjima kao sto su:

(4) Mozemo li konstruirati razumno jednostavne gramatike za sve zanimljive jezike?

(5) Jesu li takve gramatike “otkrivajuce”, u smislu da njihove sintaksne strukturemogu posluziti za semanticku analizu ili pruziti dublji uvid u koristenje i razumijevanjejezika?

Ispitat cemo nekoliko koncepcija lingvistickih struktura s obzirom na mogucnosti ikompleksnost opisa (pitanja (3) i (4)). Potom, u poglavlju 6., kratko cemo razmotritiiste teorije u odnosu na (5), i vidjet cemo da smo nezavisno vodeni istom zakljucku temogucnoscu relativne primjenjivosti za potrebe lingvistike.

2 Konacni Markovljevi procesi

2.1 Najelementarnije gramatike, koje s konacnim aparatom generiraju beskonacan brojrecenica, zasnovane su na poznatoj ideji jezika kao jednostavne vrste informacijskog iz-vora – konacnog Markovljevog procesa1. Konkretno, konacnu gramatiku G definiramokao sustav s konacnim brojem stanja S0, . . . , Sq, skupom prijelaza A = {aijk | 0 ≤ i, j ≤q; 1 ≤ k ≤ Nij za svaki i, j} te skupom stanja C = {(Si, Sj)} iz G za koje kazemo da supovezani. Prijelazom iz stanja Si u Sj , sustav generira znak aijk ∈ A2. Pretpostavimoda je

(6) Sα1 , . . . , Sαm

slijed stanja iz G te vrijedi α1 = αm = 0 i (Sαi , Sαi+1) ∈ C za svaki i < m. Prijela-zom iz stanja Sαi u stanje Sαi+1 generira se znak

(7) aαiαi+1k

za neki k ≤ Nαiαi+1 . Koristeci znak luka _ za oznacavanje operacije nadovezivanja3,

1Gramatike konacnog skupa stanja mogu se graficki prikazati dijagramima stanja, kao u [7, p. 13f].2Ovakvu vrstu konacnog procesa je danas uobicajeno modelirati formalizmom konacnog automata.

Op. prev.3Pogledati [6], Dodatak 2, za aksiomatizaciju u konkatenacijskim algebrama.

3

Page 4: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

kazemo da slijed (6) generira sve recenice

(8) aα1α2k1 _ aα2α3k2 _ . . . _ aαm−1αmkm−1

za odgovarajuci izbor ki, (tj. ki ≤ Nαiαi+1). Jezik LG koji sadrzava takve recenice, isamo njih, nazivamo jezikom kojeg generira gramatika G.

Recenice iz LG generiraju se postavljanjem sustava u pocetno stanje S0, obavljanjemprijelaza prateci slijed povezanih stanja iz pocetnog stanja do konacnog stanja (ponovoS0), okidajuci stvaranje odgovarajuceg znaka abecede A. Kazemo da je jezik L jezikkonacnog skupa stanja ako ga cine recenice generirane nekom gramatikom G s konacnimbrojem stanja4.

2.2 Pretpostavimo da je skup znakova abecede A jednak skupu engleskih fonema.Mozemo pokusati izgraditi konacnu gramatiku G koja ce generirati one, i samo one, ni-zove engleskih fonema koji su gramaticne recenice engleskog jezika. Odmah je jasno dapostupak izgradnje konacne gramatike engleskog jezika mozemo znatno pojednostavitiako za skup A uzmemo skup engleskih morfema5 ili rijeci, a gramatiku G izgradimo nanacin tako da generira gramaticne nizove koji su sacinjeni od rijeci. Gramatika se mozenadopuniti konacnim skupom pravila za fonemsko sricanje svakog fonema ili morfema,ovisno o kontekstu u kojem se nalazi. Kratko cemo razmotriti spomenuta pravila uodjeljcima 4.1 i 5.3.

Prije nego sto izravno istrazimo problem konstrukcije konacne gramatike za gene-riranje nizova engleskih morfema ili rijeci, razmotrit cemo apsolutne granice skupa je-zika konacnog skupa stanja. Pretpostavimo da abecedu A jezika L cini skup znakovaa1, . . . , an te je recenica iz L definirana sa S = a1 _ . . . _ an. Kazemo da je recenica S(i, j)-zavisna s obzirom na L ako i samo ako su zadovoljeni sljedeci uvjeti:

(9)(i) 1 ≤ i ≤ j ≤ n

(9)(ii) postoje znakovi bi, bj ∈ A sa svojstvom da je S1 recenica iz L, a S2 nije recenica izL, gdje je S1 nastala iz S zamjenom i-tog znaka iz S (konkretno, ai) s bi te je S2je nastala iz S1 zamjenom j-tog znaka iz S1 (konkretno, aj) s bj .

Drugim rijecima, S je (i, j)-zavisna s obzirom na L, ako zamjena i-tog znaka iz S(ai) s bi (bi 6= ai), povlaci odgovarajucu zamjenu j-tog znaka aj iz S s bj (bj 6= aj), dabi rezultirajuci niz znakova pripadao jeziku L.

Definiramo skup zavisnosti D = {(α1, β1), . . . , (αm, βm)} za S u L ako i samo akovrijedi:

(10)(i) 1 ≤ i ≤ m, S je (αi, βi)-zavisan u odnosu na L

(10)(ii) za svaki i, j, αi ≤ βj ,4Engl. finite-state language. Ovdje je vazno naglasiti da takav jezik ne mora sadrzavati konacan broj

recenica; naprotiv, jezici konacnog skupa stanja mogu sadrzavati konacan ili beskonacan skup recenica,iako su izvedeni iz formalnog uredaja s konacnim skupom stanja. Op. prev.

5Najmanje funkcionalne elemente gramatike nazivamo “morfemima”, npr. “boy”, “run”, “ing” u“running”, “s” u “books”, itd.

4

Page 5: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

(10)(iii) za svaki i, j, tako da je i 6= j, αi 6= αj i βi ≤ βj

Stoga, u skupu zavisnosti za S u L, svaka zavisnost je razlicita od bilo koje drugezavisnosti u obje stavke te svaki “determinirajuci” element prethodi svakom “determi-niranom” elementu, gdje zamisljamo aαi kao determinirajuci izbor za aβi .

Slijedi, ako S ima skup zavisnosti u L s m stavki, potrebno je barem 2m stanjakonacne gramatike koja generira jezik L6.

Ovo opazanje nam omogucuje definiranje nuznog uvjeta za ostvarenje jezika konacnogskupa stanja:

(11) Pretpostavimo da je L jezik konacnog skupa stanja. Postoji m takav da nijednarecenica S iz L nema skup zavisnosti s vise od m stavki.

Navedeni uvjet nam pomaze pri izgradnji beskonacnih jezika. Na primjer, jezike L1,L2, L3, opisane u (12), nije moguce opisati niti jednom gramatikom s konacnim skupomstanja.

(12)(i) L1 sadrzi nizove a _ b, a _ a _ b _ b, a _ a _ a _ b _ b _ b, . . ., tj. sverecenice koje sadrze n znakova a iza kojih slijedi tocno n znakova b, i niti jednedruge;

(12)(ii) L2 sadrzi nizove a _ a, b _ b, a _ b _ b _ a, b _ a _ a _ b, a _ a _ b _ b _a _ a, . . ., tj. sve simetricne recenice u kojima iza niza X slijedi obrnuti niz X, initi jedne druge;

(12)(iii) L3 sadrzi nizove a _ a, b _ b, a _ b _ a _ b, b _ a _ b _ a, a _ a _ b _a _ a _ b, . . ., tj. sve recenice u kojima iza niza X slijedi jos jedno ponavljanjeniza X, i niti jedne druge7.

Primjerice, u jeziku L2, za svaki m mozemo pronaci recenicu sa skupom zavisnostiDm = {(1, 2m), (2, 2m− 1), . . . , (m,m+ 1)} 8 9.

2.3 Promatrajuci engleski jezik, pokazuje se da postoji beskonacan broj recenicakoje imaju skup zavisnosti s vise elemenata od bilo kojeg fiksnog broja. Na primjer,neka su S1, S2, . . . deklarativne recenice. Onda sve sljedece recenice pripadaju engleskomjeziku:

(13)(i) If S1 then S2.

(13)(ii) Either S3 then S4.

6Buduci da skup zavisnosti ima m stavki, a svaka stavka oznacava zavisnost zamjene znaka koja semoze ili ne mora ostvariti, ukupan broj mogucih zamjena jest 21 ∗ 22 ∗ . . . ∗ 2m = 2m (broj elemenatatzv. partitivnog skupa). Op. prev.

7Navedene jezike mozemo opisati izrazima: L1 = anbn, L2 = XXR i L3 = XX. Op. prev.8U slucaju jezika L1, bj iz (9ii) mozemo promatrati kao element identitete U sa svojstvom da, za

svaki X, vrijedi U _ X = X _ U = X. Slijedi da je Dm takoder skup zavisnosti za recenicu iz L1

duljine 2m.9Za opcenitiji postupak dokaza pripadnosti jezika odredenoj klasi pogledati leme o napuhavanju za

regularne i konteksno neovisne jezike. Op. prev.

5

Page 6: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

(13)(iii) The man who said that S5, is arriving today.

Navedene recenice imaju zavisnosti izmedu “if”–“then”, “either”–“or”, “man”–“is”.Ali, moguce je izabrati za S1, S3, S5 upravo recenice (13i), (13ii) ili (13iii). Nastavljajucigradnju recenica opisanim nacinom, dolazimo do dijelova engleskog jezika sa svojstvomsimetricnosti jezika L1 i L2 iz (12). Posljedicno, uvjet (11) ne vrijedi za engleski jezik.Engleski jezik nije jezik konacnog skupa stanja i prisiljeni smo odbaciti opisani pristupjer ne vrijedi nuzni uvjet.

Moguce je zaobici navedeni ishod uvodenjem odluke o postojanju konacne gornje gra-nice duljine recenica engleskog jezika. Medutim, navedena odluka ne bi posluzila svrsi.Bit je u tome da postoje procesi gradnje recenica koje intrinzicno nije moguce prikazatipredlozenim elementarnim modelom jezika. Izostavljanjem gornje granice, moguce je do-kazati neprimjenjivost predlozenog modela; ako je granica postavljena, izgradnja konacnegramatike ne bi bila doslovno nemoguca, ali bi ta gramatika bila pretjerano kompleksna i,kao takva, prakticno beskorisna i nezanimljiva. U nastavku cemo proucavati gramatickimodel koji moze opisivati jezike s nizovima sa svojstvom simetricnosti. Dodatna mocizrazajnosti tog modela se odrazava u cinjenici da je on mnogo korisniji i “otkrivajuci”,ako se postavi gornja granica. Opcenito, pretpostavka da su jezici beskonacni je uvedenazbog pojednostavljenja opisa jezika10. Ako gramatika nije rekurzivna (petlje u prethodnoopisanom modelu), onda bi ona bila neupotrebljivo kompleksna – zapravo, gramatika nebi bila puno izrazajnija od liste nizova znakova ili sljedova morfema u slucaju prirod-nih jezika. Ako gramatika jest rekurzivna, onda ona moze generirati beskonacan brojrecenica.

2.4 Iako smo otkrili da niti jedan konacan Markovljev proces, koji generira receniceslijeva nadesno, ne moze posluziti kao gramatika engleskog jezika, mogli bi se upustiti umogucnost izgradnje slijeda takvih uredaja koji bi se, na neki netrivijalan nacin, pribliziliizlazu neke zadovoljavajuce gramatike engleskog jezika. Primjerice, pretpostavimo da zaneki fiksni n izgradimo konacnu gramatiku na sljedeci nacin: jedno stanje gramatikegenerira sekvence engleskog jezika duljine n i vjerojatnost da ce rijec X biti izabranakad je sustav u stanju Si jednaka je uvjetnoj vjerojatnosti Xi, za dani slijed od n rijecikoji definira Si. Izlaz takve gramatike se obicno opisuje kao aproksimacija n+ 1-stupnjaza engleski jezik. Jasno je da ce, s povecanjem n, izlaz takvih gramatika izgledati slicnijiengleskom jeziku, buduci da ce dulji sljedovi biti izabrani s vecom vjerojatnoscu izravnoiz uzorka engleskog jezika gdje su vjerojatnosti odredene. Ovaj uvid je povremeno vodiodo prijedloga da takav model moze posluziti kao teorija lingvisticke strukture.

Bez obzira na druge zanimljive aspekte statisticke aproksimacije ovakve vrste, jasnoje da ona ne moze razjasniti razmatrane probleme gramatike. Ne postoji opcenita re-lacija izmedu broja pojavljivanja nekog niza znakova (ili njegovih dijelova) te njegovegramaticnosti. To je moguce jasno pokazati na nizovima znakova kao sto su:

(14) colorless green ideas sleep furiously

10Primijetite da gramatika mora odrazavati i objasniti govornikovu/cinu sposobnost proizvodnje irazumijevanja novih recenica koje mogu biti dulje od svih recenica koje su prethodno opazene.

6

Page 7: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

sto je gramaticna recenica, iako je razumno pretpostaviti da niti jedan od parovanjenih rijeci se nije pojavio zajedno u proslosti. Primijetite da ce govornik/ca procitati(14) s uobicajenom intonacijom, dok ce sljedeci, podjednako od prije nepoznati, niz zna-kova:

(15) furiously sleep ideas green colorless

biti izgovoren sa silaznim naglaskom na svakoj rijeci, kao u slucaju negramaticnihrecenica. Dakle, (14) se razlikuje od (15) upravo kao sto se (1) razlikuje od (2); nasuvjetni operacijski kriterij za odredivanje gramaticnosti podrzava intuiciju da je (14)gramaticna recenica i da (15) to nije. Moguce je postaviti problem gramatike kao pro-blem objasnjavanja i rekonstruiranja mogucnosti govornika/ce za prepoznavanje (1),(14), itd. kao gramaticnih recenica, te odbijanje recenica (2), (15), itd. kao negra-maticnih. Medutim, niti jedan aproksimacijski model n-stupnja ne moze razlikovati (14)od (15) (kao ni bezbroj drugih slicnih parova). S povecanjem stupnja n, n-ta aproksima-cija engleskog jezika ce iskljucivati (sa sve manjom vjerojatnoscu izbora) sve veci brojgramaticnih recenica, dok ce jos uvijek sadrzavati velik broj negramaticnih recenica11.Stoga moramo zakljuciti da nam navedeni smjer modela gramatike nije pogodan12.

Primijetimo, iako je za svaki nmoguce prikazati aproksimaciju n-tog stupnja konacnimMarkovljevim procesom, obrnuti smjer ne vrijedi. Na primjer, promotrimo proces odtri stanja s povezanim stanjima (S0, S1), (S1, S1), (S1, S0), (S0, S2), (S2, S2), (S2, S0) i saznakovima prijelaza a, b, a, c, b, c. Ovaj proces se moze prikazati sljedecim dijagramomprijelaza:

(16)

S0 S1S2

a

c a

b

c

b

Opisani proces moze generirati recenice a _ a, a _ b _ a, a _ b _ b _ a,a _ b _ b _ b _ a, . . ., c _ c, c _ b _ c, c _ b _ b _ c, c _ b _ b _ b _ c,. . ., ali ne i a _ b _ b _ c, c _ b _ b _ a, itd. Duljine recenica prikazanog jezika sazavisnostima mogu biti bilo koja fiksna vrijednost.

U odjeljku 2.4 zakljucili smo da nema bitne korelacije izmedu stupnja aproksimacijejezika i svojstva gramaticnosti. Ako poredamo nizove znakova odredene duljine premastupnju aproksimacije engleskog jezika, pronaci cemo gramaticne i negramaticne nizovenasumce rasporedene u listi svih nizova znakova. Slijedi da koncepcija statisticke aproksi-macije nije relevantna za modeliranje gramatike. U odjeljku 2.3 ustanovili smo da mnogosira klasa procesa, konkretno - konacni Markovljevi procesi koji generiraju znakove pri-jelazima medu stanjima, ne mogu modelirati gramatiku engleskog jezika. Naime, ako

11Uvijek mozemo pronaci sljedove n + 1 rijeci, gdje se prvih i zadnjih n rijeci mogu pojaviti, ali ne uistoj recenici (npr. zamijenite “is” s “are” u (13iii) te izaberite S5 bilo koje duljine).

12Chomskyjev generativni pristup i ovdje opisan statisticki model su i dalje u sredistu mnogih debatau podrucju (racunalne) lingvistike, sto sugerira kompleksnost problema. Primjerice, pogledati “OnChomsky and the Two Cultures of Statistical Learning” (P. Norvig). Op. prev.

7

Page 8: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

izgradimo konacnu gramatiku koja generira samo recenice engleskog jezika, onda znamoda ona ne moze generirati beskonacan broj takvih recenica; takva gramatika nece mocigenerirati beskonacan broj istinitih recenica, neistinitih recenica, razumnih pitanja kojase mogu postaviti, i slicnih. U sljedecem poglavlju istrazit cemo siru klasu procesa kojibi mogli opisati gramatiku engleskog jezika.

3 Frazna struktura

3.1 Opis sintakse uobicajeno se opisuje “izravnom analizom sastavnica”, gdje se recenicegrupiraju u fraze, koje se potom grupiraju u manje sastavne fraze, itd., dok se ne do-segnu osnovne sastavnice (morfemi13). Dobivene fraze se klasificiraju kao imenicne fraze(NP14), glagolske fraze (VP15), itd. Na primjer, recenica (17) bi se mogla analizirati nasljedeci nacin:

(17)

the man took the book

NPGlagol NP

VP

Recenica

Jasno je da navedeni opis omogucuje znacajna pojednostavljenja u usporedbi s mo-delom slijeda rijeci jer kompozicija kompleksnijih vrsta izraza, kao sto je imenicna fraza,moze biti navedena samo jednom u gramatici, te se potom navedena vrsta izraza moze ko-ristiti kao gradivni element na raznim mjestima tijekom izgradnje recenice. U sljedecemodjeljku razmatramo oblik gramatike koji odgovara ovakvoj koncepciji lingvisticke struk-ture.

3.2 Gramatika frazne strukture definirana je konacnim rjecnikom (abecedom) VP ,konacnim skupom Σ pocetnih nizova znakova u VP te konacnim skupom pravila F oblika:X → Y , gdje su X i Y nizovi znakova iz VP . Svako takvo pravilo se interpretira kaonaredba: prepisi X s Y . Od svake takve gramatike [Σ, F ]

(18) Σ : Σ1, . . . ,Σn

F : X1 → Y1. . .

F : Xm → Ym

zahtijeva se da je Yi generiran iz Xi zamjenom jednog znaka iz Xi nekim nizom zna-kova. Zamijenjeni znak i zamjenjujuci niz znakova ne mogu biti identitete U .

Za zadanu gramatiku [Σ, F ] (18) kazemo:

13Pogledati biljesku na str. 4.14Engl. Noun Phrases. Op. prev.15Engl. Verb Phrases. Op. prev.

8

Page 9: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

(19)(i) niz β slijedi iz niza α ako α = Z _ Xi _ W te β = Z _ Yi _ W , za nekii ≤ m16;

(19)(ii) derivacija niza St je slijed D = S1, . . . , St nizova znakova, gdje je S1 ∈ Σ i za svakii < t, Si+1 slijedi iz Si;

(19)(iii) niz S je derivabilan iz (18) ako postoji derivacija za S u kontekstu (18);

(19)(iv) derivacija St je konacna ako ne postoji niz koji slijedi iz St;

(19)(v) niz St je zavrsni ako je on posljednji u slijedu konacne derivacije.

Derivacija je, dakle, priblizno analogna dokazu, gdje je Σ sustav aksioma, a F supravila zakljucivanja. Kazemo da je jezik L derivabilan ako je L skup nizova znakovakoji su derivabilni iz neke gramatike [Σ, F ], i kazemo da je L zavrsan jezik ako ga ciniskup zavrsnih nizova iz nekog sustava [Σ, F ].

U svakom zanimljivom slucaju postoji zavrsni rjecnik VT (VT ⊂ VP ) koji tocno opi-suje zavrsne nizove, u smislu da je svaki zavrsni niz iz VT , i niti jedan znak iz VT nijeprepisan nekim od pravila iz F . U takvim slucajevima mozemo reci da jezik koji seanalizira cine zavrsni nizovi znakova (gdje je VT rjecnik) te derivacije tih nizova znakovacine njihovu fraznu strukturu.

3.3 Za jednostavni primjer sustava zadanog oblikom opisanim u (18), razmotrimosljedeci mali dio gramatike engleskog jezika:

(20) Σ : # _ Sentence _ #F : Sentence→ NP _ V P

V P → V erb _ NPNP → the _ man, the _ bookV erb→ took

Od derivacija za (20), izdvojimo:

(21) D1 : # _ Sentence _ ## _ NP _ V P _ ## _ NP _ V erb _ NP _ ## _ the _ man _ V erb _ NP _ ## _ the _ man _ V erb _ the _ book _ ## _ the _ man _ took _ the _ book _ #

(21) D2 : # _ Sentence _ ## _ NP _ V P _ ## _ the _ man _ V P _ ## _ the _ man _ V erb _ NP _ ## _ the _ man _ took _ NP _ ## _ the _ man _ took _ the _ book _ #

16U ovom slucaju, Z i W mogu biti elementi identitete U . Buduci da smo ogranicili (18) tako da Unema znacajnu ulogu na lijevoj ili desnoj strani pravila F te dodatno, zahtijevanjem da samo jedan znaklijeve strane pravila moze biti zamijenjen tijekom primjene pravila, slijedi da Yi mora biti duljine baremkao Xi, iz cega slijedi jednostavan postupak odlucivanja derivabilnosti i zavrsenosti u smislu (19iii) i(19v).

9

Page 10: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Ocito je da su navedene derivacije ekvivalentne; razlikuju se samo u poretku primje-njivanja pravila. Ekvivalentnost je moguce graficki prikazati stablima koji, na ocigledannacin, odgovaraju derivacijama. Obje derivacije, D1 i D2, prikazuju se istim stablom:

(22)

# _ Sentence _ #

VP

NP

the book

Verb

took

NP

the man

Stablo (22) predstavlja fraznu strukturu recenice “the man took the book”, kao sto jenavedeno u (17). Opcenito, za derivaciju D niza S kazemo da je podniz s iz S jednakX ako, u stablu koje odgovara derivaciji D, postoji put iz cvorova koji pripadaju nizus prema jednom cvoru koji je oznacen s X. Dakle, za zadane D1 i D2, prema (22),kazemo da je “the _ man′′ jednak NP , “took _ the _ book′′ je V P , “the _ book′′

jednak NP , “the _ man _ took _ the _ book′′ je recenica (Sentence). Medutim, niz“man _ took′′ nije fraza navedenog niza znakova jer ga nije moguce svesti na jedan cvoru prikazanom stablu.

Pokusavajuci izgraditi najjednostavniju mogucu [Σ, F ] gramatiku engleskog jezika,otkrivamo da pojedine recenice automatski poprimaju razlicite derivacije. Osim pravilaiz (20), gramatika engleskog jezika sigurno mora sadrzavati pravila oblika

(23) V erb→ are _ flyingV erb→ areNP → theyNP → planesNP → flying _ planes

da bi mogla opisati recenice kao sto su “they are flying – a plane” (NP-Glagol-NP),“(flying) planes – are – noisy” (NP-Glagol, Pridjev), itd. Medutim, koristeci navedeniskup pravila, recenicu “they are flying planes” mozemo opisati dvama razlicitim deriva-cijama:

(24)

a. # _ Sentence _ #

VP

NP

flying planes

Verb

are

NP

they

b. # _ Sentence _ #

VP

NP

planes

Verb

are flying

NP

they

10

Page 11: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Stoga promatranoj recenici mogu biti dodijeljene dvije frazne strukture; recenicamoze biti analizirana kao “they – are – flying planes” ili “they – are flying – planes”.I zapravo, recenica je nejednoznacna upravo na opisani nacin; “tocke na horizontu – su– zrakoplovi koji lete”, ili “piloti – upravljaju – zrakoplovima”. Kada najjednostavnijagramatika stvara razlicite derivacije neke recenice, sto zovemo konstrukcijska homoni-mija, onda mozemo predloziti upravo predstavljeno formalno svojstvo kao objasnjenjesemanticke nejednoznacnosti promatrane recenice. U 1. poglavlju pitali smo se da ligramatika moze pruziti dublji uvid u koristenje i razumijevanje jezika (vidi ((5)). Akose za slucajeve konstrukcijske homonimije utvrdi da su oni zapravo slucajevi semantickenejednoznacnosti, kao sto je to utvrdeno za (24), onda navedeni postupak moze posluzitikao nacin ispitivanja prikladnosti gramatike. Ovaj vazan problem bit ce obraden u 6.poglavlju.

U (20)-(24) granice recenice oznacavaju se znakom #, koji moze biti dio zavrsnogrjecnika VT opisanog u posljednjem paragrafu odjeljka 3.2.

3.4 Predstavljeni segmenti gramatike engleskog jezika su vrlo pojednostavljeni unekoliko aspekata. Za pocetak, pravila iz (20) i (23) imaju samo jedan znak na lijevojstrani pravila, iako nisu zadana takva ogranicenja na [Σ, F ] gramatiku u 3.2. Pravilooblika:

(25) Z _ X _W → Z _ Y _ W

definira da X moze biti prepisan s Y samo u kontekstu X – W. Lako je pokazati dauvodenje takvih pravila znacajno pojednostavljuje gramatiku. U odjeljku 3.2 zahtijevase da, u pravilima kao sto je (25), X moze biti samo jedan znak. Na taj nacin osiguravase da je stablo frazne strukture moguce izgraditi na temelju bilo koje derivacije. Takoder,gramatiku je moguce dodatno pojednostaviti ako su pravila poredana i primijenjena uslijedu (zapocinjanje s ponovo prvim pravilom nakon sto je primijenjeno zadnje pravilopromatranog slijeda) te ako je uvedena podjela izmedu obaveznih pravila, koja morajubiti primijenjena kad su dosegnuta u slijedu, i neobaveznih pravila, koja se mogu primi-jeniti uvjetno. Navedene preinake ne smanjuju generativnu moc gramatike, a rezultirajuznacajnom smanjenju kompleksnosti.

Cini se razumnim traziti neko jamstvo da ce gramatika zaista generirati velik brojrecenica u ogranicenom vremenu; tocnije, da je nemoguce prolaziti slijedno kroz pravilagramatike bez primjenjivanja pravila, osim ako zadnja recenica derivacije koja se gene-rira nije niz zavrsnih znakova. Opisani zahtjev mozemo ispuniti postavljanjem odredenihuvjeta o pojavljivanju obaveznih pravila u slijedu pravila. Definiramo pravilnu17 gra-matiku kao sustav [Σ, Q], gdje je Σ skup pocetnih nizova znakova, a Q je slijed pra-vila oblika Xi → Yi, kao u (18), s dodatnim uvjetom da za svaki i mora biti baremjedan j tako da vrijedi Xi = Xj i pravilo Xj → Yj je obavezno. Slijedi da svakastavka na lijevoj strani pravila mora biti navedena u barem jednom obaveznom pra-vilu. Ovo je najslabiji jednostavni uvjet koji jamci pomak nezavrsne derivacije premazavrsnom nizu znakova prolazom kroz pravila. Dodatno vrijedi, ako se Xi moze pre-pisati kao jedan od nizova Xi1 , . . . , Xik , onda barem jedan prijepis mora biti primije-

17Engl. proper. Op. prev.

11

Page 12: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

njen. Medutim, pravilne gramatike su razlicite od [Σ, F ] gramatika. Neka je D(G)skup derivacija kojeg je moguce generirati iz gramatike frazne strukture G, gdje G nemora nuzno biti pravilna gramatika. Neka je DF = {D(G) |Gjest [Σ, F ] gramatika} iDQ = {D(G) |Gjest pravilna gramatika}, onda vrijedi:

(26) DF i DQ su neusporedivi; tj. DF 6⊂ DQ i DQ 6⊂ DF .

Odnosno, postoje sustavi fraznih struktura koje je moguce opisati [Σ, F ] gramati-kama, ali ne i pravilnim gramatikama, te ostali sustavi koje je moguce opisati pravilnimgramatikama, ali ne [Σ, F ] gramatikama.

3.5 Definirali smo tri vrste jezika: konacne (odjeljak 2.1), derivabilne i zavrsnejezike (odjeljak 3.2). Za navedene vrste jezika vrijedi:

(27)(i) svaki konacan jezik je i zavrsan jezik; obrnuto ne vrijedi;

(27)(ii) svaki derivabilan jezik je i zavrsan jezik; obrnuto ne vrijedi;

(27)(iii) postoje derivabilni, beskonacni jezici i konacni, nederivabilni jezici.

Pretpostavimo da je LG konacan jezik s konacnom gramatikom G, kao sto je defi-nirano u odjeljku 2.1. Gramatiku [Σ, F ] konstruiramo na sljedeci nacin: Σ = {S0}; Fsadrzi pravilo oblika (28i) za svaki i, j, k tako da vrijedi (Si, Sj) ∈ C, j 6= 0, i k ≤ Ni,j ;F sadrzi pravilo oblika (28ii) za svaki i, k tako da vrijedi (Si, S0) ∈ C i k ≤ Ni,0.

(28)(i) Si → aijk _ Sj

(28)(ii) Si → ai0k

Jasno je da ce zavrsni jezik kojeg generira gramatika [Σ, F ] biti upravo jezik LG,potvrdujuci prvi dio od (27i).

U odjeljku 2.2 pokazano je da jezici iz (12) L1, L2 i L3 nisu jezici konacnog skupastanja. Medutim, jezici L1 i L2 su zavrsni jezici. Primjerice, za jezik L1 mozemo izgra-diti sljedecu [Σ, F ] gramatiku, potvrdujuci (27i):

(29) Σ : ZF : Z → a _ bF : Z → a _ Z _ b

Pretpostavimo da je L4 derivabilan jezik s rjecnikom VP = {a1, . . . , an}. Dodatno,pretpostavimo da dodamo gramatici jezika L4 konacan skup pravila ai → bi, gdje zna-kovi bi nisu u VP te su svi razliciti. Slijedi da rezultirajuca gramatika generira zavrsnijezik koji je jednostavno drugaciji zapis izvornog jezika L4. Slijedi da je svaki derivabilanjezik takoder i zavrsni jezik.

Kao primjer zavrsnog, nederivabilnog jezika razmotrit cemo jezik L5 kojeg cine nizoviznakova oblika:

12

Page 13: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

(30) a _ b, c _ a _ b _ d, c _ c _ a _ b _ d _ d, c _ c _ c _ a _ b _ d _d _ d, . . .

Beskonacan derivabilan jezik mora sadrzavati beskonacan skup nizova znakova kojise mogu poredati u slijed s1, s2, . . . tako da, za pravilo oblika X → Y , si mora slijeditiiz si−1 primjenom tog pravila, za svaki i > 1. Nadalje, Y iz navedenog pravila morabiti generiran iz X zamjenom jednog znaka s nizom znakova (usp. (18)). Prethodni zah-tjev nije moguce ostvariti za jezik L5. Medutim, jezik L5 je zavrsni jezik kojeg generirasljedeca gramatika:

(31) Σ : ZF : Z → a _ bF : Z → c _ Z _ d

Primjer nederivabilnog jezika konacnog skupa stanja je jezik L6 kojeg cine nizoviznakova s 2n ili 3n brojem znakova a, za svaki n = 1, 2, . . .. Jezik L1 iz (12) je derivabi-lan jezik koji nije jezik konacnog broja stanja s pocetnim nizom znakova a _ b i pravilom:

a _ b→ a _ a _ b _ b.

Glavni smisao teorema (27) je taj da je opis jezika fraznom strukturom ne samo jed-nostavniji nego i mocniji u usporedbi s konacnim gramatikama koje generiraju receniceslijeva nadesno. U odjeljku 2.3 pokazali smo da engleski jezik ne pripada skupu jezikakoje je moguce generirati takvim gramatikama zbog svojstva simetricnosti koje dijeli sjezicima L1 i L2 iz (12). Medutim, upravo smo vidjeli da su jezici L1 i L2 zavrsni jezici.Dakle, razmatranja koja su nas dovela do odbacivanja modela konacnog skupa stanja,ne dovode nas do toga da na slican nacin odbacimo mocniji model frazne strukture.

Primijetite da je potonji model apstraktniji od modela konacnog skupa stanja jer suelementi koji nisu dio rjecnika jezika ukljuceni u opis tog istog jezika. Koristeci definicijeiz 3.2, VP je pravi podskup od VT . Tako u slucaju (29), L1 se opisuje koristeci elementZ, koji nije u L1; a u slucajevima (20)− (24) se u opis strukture engleskog jezika uvodesimboli kao sto su Sentence,NP, V P itd., koji nisu rijeci engleskog jezika.

3.6 Gramatika [Σ, F ] oblika (18) moze se interpretirati kao jednostavni proceskonacnog skupa stanja na sljedeci nacin. Razmotrimo sustav s konacnim brojem stanjaS0, . . . , Sq. Sustav u stanju S0 generira bilo koji niz iz Σ te prelazi u novo stanje. Stanjesustava je odredeno podskupom elemenata X1, . . . , Xm koji su podnizovi zadnjeg generi-ranog niza znakova te se prijelaz u novo stanje obavlja primjenom jednog od pravila nadpromatranim nizom znakova, cime se generira novi niz znakova. Dakle, ovakav sustavgenerira derivacije kao u 3.2. U svakom trenutku proces odreduju trenutno stanje i zad-nji generirani niz znakova i postoji konacna gornja granica broja potrebnih akcija nadtrenutnim nizom potrebnih da bi se proces nastavio te da bi se generirao novi niz zna-kova koji se razlikuje na jedan od konacnog broja nacina od zadnjeg promatranog niza18.

18Chomsky ovdje daje naznake ekvivalentnosti gramatike i formalnog automata (procesa), sto ce de-taljno razraditi 3 godine nakon objave ovog rada (1959.) razvojem koncepcije danas poznate kao Chom-skyjeva hijerarhija formalnih jezika. Op. prev.

13

Page 14: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Nije tesko izgraditi jezike koji ne pripadaju skupu jezika koje je moguce opisati [Σ, F ]gramatikama. Zapravo, jezik L3 iz (12iii) nije zavrsni jezik19. Ja ne znam je li engleskijezik zavrsni jezik i ne znam postoje li drugi jezici koji su izvan onoga sto je moguceopisati modelom frazne strukture. Stoga ne vidim nacina kako odbaciti ovu teorijulingvisticke strukture na temelju razmatranja iz (3). Medutim, kada se okrenemo pitanjukompleksnosti opisa (usp. (4)), nalazimo da postoji osnova koja vodi k zakljucku da jeova teorija lingvisticke strukture u osnovi neprikladna. Istrazit cemo nekoliko problemado kojih moze doci pri pokusaju prosirenja sustava iz (20) prema potpunoj gramaticiengleskog jezika.

4 Nedostaci gramatike frazne strukture

4.1 U (20) smo razmatrali samo jedan nacin prijepisa elementa Verb u niz znakova“took”. Medutim, cak i uz fiksni korijen glagola, postoji mnostvo glagolskih oblika kojise mogu koristiti u kontekstu “the man – the book”, npr. “takes”, “has taken”, “has beentaking”, “is taking”, “has been taken”, “will be taking”, itd. Izravni opis navedenog skupaelemenata bio bi prilicno slozen zbog izrazene zavisnosti medu elementima (npr. “hastaken”, ali ne “has taking”, “is being taken”, ali ne i “is being taking” itd.). Zapravo,mozemo dati vrlo jednostavnu analizu elementa “Verb” kao slijeda nezavisnih eleme-nata, koji pripadaju skupu odredenih nekontinuiranih nizova. Primjerice, frazu “hasbeen taking” je moguce razdvojiti u isprekidane nizove “has..en”, “be..ing” i “take”, kojeje moguce proizvoljno kombinirati. Sustavno slijedeci navedeni postupak, zamjenjujemozadnje pravilo iz (20) s:

(32) (i) V erb→ Auxiliary _ V(ii) V → take, eat, . . .(iii) Auxiliary → C(M)(have _ en) (be _ ing) (be _ en)(iv) M → will, can, shall, may, must(v) C → past, present

Pravilo (32iii) interpretiramo na sljedeci nacin: u derivaciji elementa “Auxiliary”moramo izabrati element C (koji nije naveden unutar zagrada) te mozemo izabrati nulaili vise elemenata u zagradama, u navedenom redoslijedu. Stoga, daljnjim razvijanjemderivacije D1 iz (21) od retka 5., dobivamo:

19Jezik L3 (str. 5.) pripada razredu konteksno ovisnih jezika u Chomskyjevoj hijerarhiji. Za analizira-nje jezika iz tog razreda potreban je (linearno ogranicen) Turingov stroj. (Jezici L1 i L2 pripadaju razredukonteksno neovisnih jezika i za njihovo prihvacanje je dovoljan potisni automat – konacni automat sastogom.) Op. prev.

14

Page 15: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

(33) # _ the _ man _ V erb _ the _ book _ #[od D1 iz (21)]

# _ the _ man _ Auxiliary _ V _ the _ book _ #[(32i)]

# _ the _ man _ Auxiliary _ take _ the _ book _ #[(32ii)]

# _ the _ man _ C _ have _ en _ be _ ing _ take _ the _ book _ #[(32iii), biranjem elemenata C, have _ en, be _ ing]

# _ the _ man _ past _ have _ en _ be _ ing _ take _ the _ book _ #[(32v)]

Neka je Af klasa afiksa koju cine “en”, “ing” i C. Nadalje, neka je v klasa koju cinesvi V i M te “have” i “be”. Posljednji redak iz (33) mozemo preoblikovati u pravilnoporedani slijed morfema koristeci pravilo:

(34) Af _ v → v _ Af _ #

Primjenjujuci navedeno pravilo nad svakim od tri Af _ v slijeda zadnjeg retka u(33), dobivamo:

(35) # _ the _ man _ have _ past _ # _ be _ en _ # _ take _ ing _ # _the _ book _ #

U prvom odjeljku u 2.2 spomenuli smo da ce gramatika sadrzavati skup (morfofonem-skih) pravila koji obavljaju pretvorbu nizova morfema u nizove fonema. U morfofonemiciengleskog jezika, pravila su oblika (koristeci konvencionalnu, umjesto fonemske ortogra-fije):

(36) have _ past→ hadbe _ en→ beentake _ ing → takingwill _ past→ wouldcan _ past→ couldM _ present→Mwalk _ past→ walkedtake _ past→ tookitd.

Primjenjujuci morfofonemska pravila nad (35), izvodimo recenicu:

(37) the man had been taking the book

Slicno, uz jednu znacajnu iznimku koju cemo razmotriti u nastavku (i nekoliko manjevaznih iznimaka koje cemo zanemariti u ovom radu), pravila (32) i (34) ce generirati sve

15

Page 16: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

druge glagolske oblike deklarativnih recenica, i samo njih.

Ova vrlo pojednostavljena analiza, medutim, nije podrzana [Σ, F ] gramatikama unekoliko aspekata. Pravilo (34), iako sasvim jednostavno, ne moze se izraziti pravilima[Σ, F ] gramatike jer takva pravila ukljucuju samo elemente u slijedu. Nadalje, da biprimijenili pravilo (34) na zadnji redak od (33), moramo znati da je “take” element V ,dakle u klasi v. Drugim rijecima, da bi se moglo primijeniti pravilo, potrebno je znativise od samog niza znakova nad kojim se pravilo primjenjuje; nuzno je poznavati osnovnustrukturu niza znakova ili, slicno prema 3.3, razmotriti neke ranije stavke promatranederivacije. Buduci da pravilo (34) zahtijeva poznavanje “povijesti derivacije”, ono krsiosnovno svojstvo [Σ, F ] gramatike opisano u 3.6.

4.2 Cinjenica da ova jednostavna analiza glagolske fraze, kao slijeda nezavisnoizabranih jedinica, izlazi izvan granica [Σ, F ] gramatika, daje naslutiti da su takvegramatike previse ogranicavajuce da bi mogle dati pravu sliku lingvisticke strukture.Daljnje proucavanje opisane glagolske fraze dodatno potvrduje tvrdnju. Postoji vaznoogranicenje svojstva nezavisnosti elemenata uvedenog u (32). Odabirom neprijelaznogglagola (npr. “come”, “occur”, itd.) kao elementa V u (32), nije moguce odabratibe _ en kao pomocni element. Ne mozemo imati fraze kao sto su “John has beencome”, “John is occurred” i slicne. Dodatno, element be _ en ne moze biti odabrannezavisno od konteksta fraze “Verb”. Ako se element “Verb” nalazi u kontekstu “theman – the food”, nije moguce odabrati be _ en iz (32), iako je moguce izabrati bilokoji drugi element iz (32). Odnosno, moguce su recenice “man is eating the food”, “theman would have been eating the food”, itd., ali ne i “the man is eaten the food”, “theman would have been eaten the food” itd. S druge strane, ako je kontekst fraze “Verb”,primjerice, “the food – by the man”, u tom slucaju moramo izabrati be _ en. Mogucaje recenica “the food is eaten by the man”, ali ne i “the food is eating by the man” itd.Ukratko, nalazimo da je element be _ en dio razradenog sustava ogranicenja kojima serazlikuje od svih drugih elemenata uvedenih kod analize elementa “Verb” u (32). Ovokompleksno i jedinstveno ponasanje oblika be _ en daje naslutiti da bi bilo pozeljno iz-baciti promatrani element iz (32) i uvesti pasivne oblike u gramatiku na neki drugi nacin.

Zapravo, postoji vrlo jednostavan nacin uvodenja pasivnih oblika poput be _ en ugramatiku. Primijetite da za svaku aktivnu recenicu, kao sto je npr. “the man ate thefoods”, postoji odgovarajuci pasivni oblik – “the food was eaten by the man”, i obrnuto.Dalje, pretpostavimo da se element be _ en ne nalazi u (32iii) te da je dodano sljedecepravilo:

(38) Ako je S recenica oblika NP1−Auxiliary−V −NP2, onda je NP2−Auxiliary _be _ en− V − by _ NP1 takoder recenica.

Primjerice, ako je “the man - past - eat the food” (NP1 − Auxiliary − V − NP2)recenica, onda je “the food - past be en - eat - by the man” (NP2 − Auxiliary _ be _en− V − by _ NP1) takoder recenica. Pravila (34) i (36) pretvorila bi prvu recenicu u“the man ate the food”, a drugu u “the food was eaten by the man”.

Prednosti ovakve analize pasivnih oblika su ocigledni. Buduci da je element be _ enizbacen iz (32), nije potrebno promatrati (32) kroz kompleksni sustav ogranicenja opi-

16

Page 17: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

san u prethodnom odjeljku. Cinjenica da se be _ en moze pojaviti samo uz tranzitivneglagole, da se ne moze pojaviti u kontekstu “the man – the food”, ali da je nuzan ukontekstu “the food – by the man”, sada je izravna posljedica upravo dane analize.

Medutim, pravilo oblika (38) je daleko izvan okvira izrazajne moci gramatike fraznestrukture. Poput (34), pravilo (38) mijenja redoslijed elemenata niza nad kojim se pri-mjenjuje te pritom zahtijeva opsezno poznavanje strukture promatranog niza. Daljnjomprovedbom detaljne analize engleskog jezika, otkrivamo da postoji mnostvo slucajevagdje se gramatika moze pojednostaviti ako se [Σ, F ] sustav nadogradi pravilima oblika(38). Nazovimo takva pravila gramatickim transformacijama. Razmotrit cemo ukratkoformalna svojstva transformacijske gramatike, kao treceg modela za opis lingvistickestrukture, koja se moze nadovezati na [Σ, F ] gramatiku frazne strukture20.

5 Transformacijska gramatika

5.1 Gramaticka transformacija T je, u osnovi, pravilo koje pretvara recenice odredenestrukture u nove recenice s izvedenom strukturom. Transformirani niz i njegova izvedenastruktura moraju biti povezani na fiksan i konstantan nacin sa strukturom transformira-nog niza, za svako pravilo T . Mozemo opisati pravilo T definiranjem, u smislu strukture,domene nizova znakova nad kojima se pravilo primjenjuje te opisom promjene koje onouzrokuje.

Pretpostavimo da je zadana [Σ, F ] gramatika s rjecnikom VP i zavrsnim rjecnikomVT ⊂ VP , kao u 3.2.

U odjeljku 3.3 pokazano je da [Σ, F ] gramatika dozvoljava derivaciju zavrsnih nizovaznakova te smo istaknuli da ce, u opcenitom slucaju, promatrani zavrsni niz imati viseekvivalentnih derivacija. Derivacije su ekvivalentne ako se mogu prikazati istim sta-blom, kao u (22)21. Pretpostavimo da je D1, . . . Dn skup svih22 ekvivalentnih derivacijazavrsnog niza S. Definiramo fraznu oznaku za S kao skup nizova koji se pojavljuju kaoreci derivacija D1, . . . Dn. Niz ce imati vise od jedne frazne oznake ako i samo ako imaneekvivalentne derivacije (usp. (24)).

Pretpostavimo da je K frazna oznaka od S. Kazemo da je

(39) (S,K) rastavljiv na X1, . . . , Xn ako i samo ako postoje nizovi s1, . . . , sntako da vrijedi(i) S = s1 _ . . . _ sn(ii) za svaki i ≤ n, K sadrzava niz

s1 _ . . . _ si−1 _ Xi _ si+1 _ . . . _ sn

(40) U ovom slucaju, si jest Xi u S s obzirom na K.

20Pogledati [1] za detaljnu izgradnju algebre transformacija za potrebe lingvistickog opisa. Daljnjaprimjena analize ove vrste moze se naci u [3] i [2] te u [4], s nesto drugacije tocke gledista.

21Nije tesko dati strogu definiciju relacije jednakosti, iako se radi o prilicno zamornom poslu.22Engl. maximal set. Op. prev.

17

Page 18: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Relacija definirana u (40) je upravo ista ona relacija jednakosti definirana u odjeljku3.3; odnosno, si jest Xi u smislu (40) ako i samo ako je si podniz od S za koji postojiput prema jednom cvoru u stablu oblika kao u (22), i taj cvor stabla je oznacen s Xi.

Gore definirani pojam rastavljivosti omogucava nam da precizno odredimo domenuprimjene transformacije. Svakoj transformaciji pridruzujemo razred ogranicenja23 R:

(40) R je razred ogranicenja ako i samo ako za neki r,m, R je skup sljedova:

X11 , . . . , X

1r

.

.Xm

1 , . . . , Xmr

gdje je Xji niz iz rjecnika VP , za svaki i, j. Kazemo da niz S s fraznom oznakom K

pripada domeni transformacije T ako razred ogranicenja R pridruzen transformaciji Tsadrzi slijed Xj

1 , . . . , Xjr na kojeg je (S,K) rastavljiv. Slijedi da je domena transformacije

skup uredenih parova (S,K) niza S i frazne oznake K od S. Transformacija moze bitiprimijenjena na S s jednom fraznom oznakom, ali ne i drugom, u slucaju nejednoznacnestrukture sastavnica niza S.

Primjerice, pasivnoj transformaciji opisanoj u (38) pridruzen je razred ogranicenjaRP kojeg cini samo jedan slijed:

(42) RP = {(NP,Auxiliary, V,NP )}.

Dakle, ova transformacija se moze primijeniti na bilo koji niz koji je rastavljiv naslijed NP −Auxiliary− V −NP . Primjerice, moze se primijeniti na niz (43) rastavljivna podnizove s1, . . . , s4, u skladu s crticama:

(43) the man – past – eat – the food.

5.2 Na prikazani nacin moguce je opisati, u smislu strukture, skup nizova znakova(s pripadajucim fraznim oznakama) nad kojima je moguce primijeniti transformacije.Sada moramo definirati strukturalne promjene koje transformacija uzrokuje nad nizo-vima unutar promatrane domene. Osnovna transformacija t definirana je svojstvom:

(44) Za svaki par cijelih brojeva n, r (n ≤ r), postoji jedinstven slijed cijelihbrojeva a0, a1, . . . , ak i jedinstven slijed nizova iz VP (Z1, . . . , Zk+1) takoda

(i) a0 = 0; k ≥ 0; 1 ≤ aj ≤ r za 1 ≤ j ≤ k;Y0 = U24

(ii) za svaki Y1, . . . , Yr,t(Y1, . . . , Yn;Yn, . . . , Yr) = Ya0 _ Z1 _ Ya1 _ Z2 _ Ya2 _ . . . _Yak _ Zk+1.

23Engl. restricting class. Op. prev.

18

Page 19: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Prema tome, t se moze shvatiti kao pretvorba pojavljivanja Yn u kontekstu:

(45) Y1 _ . . . _ Yn−1 _ −_ Yn+1 _ . . . _ Yr

u odredeni niz oblika Ya0 _ Z1 _ . . . _ Yak _ Zk+1, koji je jedinstven, za zadanislijed elemenata (Y1, . . . , Yr) na koje je Y1 _ . . . _ Yr podijeljen. Dakle, t preoblikujeniz Y1 − . . . − Yr u novi niz W1 − . . . −Wr, koji je u fiksnom odnosu s Y1 − . . . − Yr.Preciznije, za t vezemo deriviranu transformaciju t∗:

(46) t∗ je derivirana transformacija od t ako i samo ako za svaki Y1, . . . , Yr, t∗(Y1, . . . , Yr) =

W1 _ . . . _ Wr, gdje je Wn = t(Y1, . . . , Yn;Yn, . . . , Yr), za svaki n ≤ r.

Za svaku transformaciju T vezemo osnovnu transformaciju t. Na primjer, za pasivnutransformaciju (38) vezemo osnovnu transformaciju tp definiranu kao:

(47) tp(Y1;Y1, . . . , Y4) = Y4tp(Y1, Y2;Y2, Y3, Y4) = Y2 _ be _ entp(Y1, Y2, Y3;Y3, Y4) = Y3tp(Y1, . . . , Y4;Y4) = by _ Y1tp(Y1, . . . , Yn;Yn, . . . , Yr) = Yn za sve n ≤ r 6= 4.

Derivirana transformacija t∗p, dakle, ima sljedeci ucinak:

(48) (i) tp(Y1, . . . , Y4) = Y4 − Y2 _ be _ en− Y3 − by _ Y1(ii) tp(the _ man, past, eat, the _ food) =

the _ food− past _ be _ en− eat− by _ the _ man.

Pravila (34), (36) preoblikuju desnu stranu (48ii) u “the food was eaten by the men”,na slican nacin kao sto iz (43) nastaje odgovarajuci aktivni oblik “the man ate the food”.

Par (Rp, tp), kao u (42) i (47), potpuno definira pasivne transformacije opisane u(38). Rp nam govori nad kojim nizovima je moguca primjena transformacije (za zadanefrazne oznake) te kako rasclaniti nizove tijekom primjene transformacije, a tp nam govorio strukturalnim promjenama rasclanjenih nizova.

Gramaticka transformacija je potpuno definirana razredom ogranicenja R i osnov-nom transformacijom t, od kojih je svaku moguce konacno opisati, kao u slucaju pasiva.Nije tesko strogo definirati mehanizme ove specifikacije, slicno prethodno ilustriranompostupku. S ciljem potpunog oblikovanja transformacijske gramatike, nuzno je poka-zati kako transformacija automatski pridruzuje deriviranu fraznu oznaku svakom izve-denom nizu te kako poopciti transformacije nad nizovima znakova (ove i srodne teme suobradene u [1]). Slijedi da ce transformacija preoblikovati niz S s fraznom oznakom K(ili slijed takvih parova) u niz S′ s deriviranom fraznom oznakom K ′.

5.3 Prethodna razmatranja nas vode prema tripartitnoj strukturi gramatike. Premaanalizi frazne strukture postoje pravila oblika X → Y , npr. (20), (23), (32). Nadalje,uvedena su i transformacijska pravila kao sto su (34) i (38). Konacno, imamo i sljedovemorfofonemskih pravila kao (36), ponovo u obliku X → Y . Da bi iz takve gramatike

19

Page 20: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

generirali recenicu, moramo konstruirati prosirenu derivaciju, pocevsi s pocetnim nizomgramatike frazne strukture, npr. # _ Sentence _ #, kao u (20). Nakon toga, primje-njujuci pravila frazne strukture generiramo zavrsni niz. Nakon generiranja zavrsnog niza,primjenjujemo odredene transformacije s ciljem postavljanja niza morfema u ispravanredoslijed, moguce sasvim razlicit od ulaznog zavrsnog niza. Primjena morfofonemskihpravila obavlja pretvorbu u niz fonema. Mozda ce pravila gramatike frazne strukture bitiprimijenjena u slijedu vise puta, nakon kojih ce se primijeniti poopcena transformacijanad generiranim zavrsnim nizom.

U odjeljku 3.4 naveli smo da je korisno poredati pravila frazne strukture i razlikovatiobavezne od neobaveznih pravila. Isto vrijedi i za transformacijski dio gramatike. U 4.poglavlju razmatrali smo transformaciju (34), koja pretvara slijed afiks – glagol u slijedglagol – afiks, i pasivnu transformaciju (38). Primijetite da (34) mora biti primijenjena usvakoj prosirenoj derivaciji, u suprotnom rezultat nece biti gramaticna recenica. Slijedida je pravilo (34) obavezna transformacija. Medutim, pasivna transformacija se moze,ali i ne mora, primijeniti; u oba slucaja rezultat ce biti gramaticna recenica. Pasiv jedakle neobavezna transformacija. Odvajanje obaveznih od neobaveznih transformacijavodi nas k razlikovanju dva razreda recenica nekog jezika. S jedne strane, imamo jezgru25

osnovnih recenica izvedenih iz zavrsnih nizova gramatike frazne strukture primjenom is-kljucivo obaveznih transformacija. Takoder, postoji i skup izvedenih recenica koje sunastale primjenom neobaveznih transformacija nad nizovima recenica jezgre.

Detaljnom provedbom analize strukture engleskog jezika, nalazimo da se gramatikamoze znatno pojednostaviti ako ogranicimo jezgru na vrlo mali skup jednostavnih, ak-tivnih i deklarativnih recenica (zapravo, vjerojatno i konacan skup takvih recenica), kaosto je “the man ate the food”, itd. Dalje, transformacijama izvodimo pitanja, pasivneoblike, recenice s veznicima, recenice sa slozenim imenicnim frazama (npr. “proving thattheorem was difficult”, gdje je NP jednak “proving that theorem”),26 itd. Buduci da jerezultat transformacije recenica s izvedenom strukturom sastavnica, moguce su slozenetransformacije te mozemo izvoditi pitanja iz pasivnih oblika (npr. “was the food eaten bythe man”), itd. Recenice u stvarnom zivotu obicno nisu jezgrene recenice nego njihoveprilicno komplicirane transformacije. Medutim, nalazimo da transformacije, u velikojmjeri, zadrzavaju smisao pa tako mozemo promatrati recenice jezgre kao osnovne “ele-mente sadrzaja” u smislu “razumijevanja” transformacije. Navedeni problem razmotritcemo kratko u 6poglavlju te detaljnije u radovima [3], [2].

U odjeljku 3.6 istaknuli smo da je gramatika frazne strukture prilicno elementarnavrsta procesa konacnog skupa stanja odredena, u svakom trenutku, trenutnim stanjem iogranicenoj kolicini njenog zadnjeg izlaza. U 4. poglavlju smo otkrili da se radi o ozbilj-nom ogranicenju te da se gramatika moze pojednostaviti dodavanjem transformacijskihpravila koji uzimaju u obzir pojedine elemente strukture sastavnica (npr. dijelove povi-jesti derivacija). Medutim, svaku transformaciju je moguce jasno opisati (usp. 5.1-2 ) i

25Engl. kernel. Op. prev.26Primijetite da ova recenica zahtijeva poopcenu transformaciju koja prihvaca par nizova s pridruzenim

fraznim oznakama. Dakle, transformacija obavlja pretvorbu S1, S2 oblika NP − V P1, it − V P2, res-pektivno, u niz: ing _ V P1 − V P1. Iz S1 =“they – prove that theorem”, S2 =“it – was difficult” u“ing prove that theorem – was difficult”, sto prema (34) postaje “proving that theorem was difficu1t”.Pogledati [3], [2] za detalje.

20

Page 21: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

konacan razred ogranicenja (41) pridruzen transformaciji pokazuje koliko informacija onizu je potrebno da bi se mogla primijeniti transformacija. Stoga, opisana gramatika sei dalje moze promatrati kao elementaran proces konacnog skupa stanja iste vrste kao igramatika frazne strukture. Postoji i dalje granica, za svaku gramatiku, broja pregledaprethodnih izlaza da bi se proces derivacije mogao nastaviti, cak i ako nije dovoljno znatisamo zadnji izlaz (zadnji redak derivacije).

6 Eksplanativna moc lingvistickih teorija

Do sada smo razmatrali relativnu prikladnost teorija lingvisticke strukture samo u smisluformalnih kriterija kao sto je jednostavnost. U prvom poglavlju smo predlozili posto-janje i drugih relevantnih razmatranja prikladnosti takvih teorija. Mozemo se pitati(vidi (5)) da li sintaksne strukture otkrivene ovim teorijama pruzaju uvid u koristenje irazumijevanje jezika. Ovdje se mozemo samo dotaknuti navedenog problema, ali i ovokratko razmatranje sugerirat ce da ovaj kriterij pruza isti stupanj relativne prikladnostiza tri predstavljena modela.

Da bi gramatika mogla posluziti kao uvid u razumijevanje jezika, moraju postojatinacini provedbe alternativnih analiza za zadanu nejednoznacnu recenicu (tj. recenicukoja se moze razumjeti na vise nacina). Drugim rijecima, ako je recenica S nejed-noznacna, moguce je ispitati prikladnost koristene lingvisticke teorije utvrdivanjem dali najjednostavnija gramatika, izgradena na temelju promatrane teorije i zadanog jezika,omogucuje razlicite nacine generiranja recenice S. U kontekstu prethodno opisanog testaprikladnosti, opravdano je usporediti konacne procese, fraznu strukturu i transformacij-ske modele.

U 3.3 naglasili smo da najjednostavnije [Σ, F ] gramatike engleskog jezika generi-raju razlicite derivacije za nejednoznacnu recenicu “they are flying planes”. Medutim,ovo rasudivanje nije primjenjivo i za gramatike konacnog skupa stanja. Odnosno, nepostoji jasna motivacija za pridruzivanje dva razlicita nacina generiranja navedene ne-jednoznacne recenice, u niti jednoj od vise gramatika konacnog skupa stanja koje mogubiti predlozene za generiranje dijela engleskog jezika.

Daljnjim razmatranjem engleskog jezika dolazimo do primjera koje nije moguce jed-nostavno opisati fraznom strukturom. Razmotrimo frazu:

(49) the shooting of the hunters.

U frazi je moguce razumjeti “hunters” kao subjekt, analogno (50), ili kao objekt,analogno (51).

(50) the growling of lions

(51) the raising of flowers.

Medutim, fraze (50) i (51) nisu nejednoznacne na isti nacin. Ipak, u kontekstu fraznestrukture, obje fraze mozemo prikazati kao: the− V _ ing − of _ NP .

21

Page 22: Tri modela za opis jezika · gramatika engleskog jezika. Nadalje, posebna podklasa takvih procesa, koji gene-riraju statisti cke aproksimacije n-tog stupnja, ne pribli zavaju se izlazu

Pazljiva analiza engleskog jezika pokazuje da mozemo pojednostaviti gramatiku akoiz jezgre izbacimo fraze (49)-(51) te ih potom uvedemo kao transformaciju T1, koja ge-nerira (50) iz recenice “lions grows” i transformaciju T2, koja iz “they raise flowers”generira (51). T1 i T2 slicne su nominalizirajucim transformacijama27, kada su ispravnoizgradene. Obje recenice “hunters shoot” i “they shoot the hunters” su jezgrene recenice;primjena T1 na prvu, odnosno T2 na drugu recenicu, generira (49). Slijedi da za (49)postoje dva razlicita transformacijska izvora. Radi se o slucaju konstrukcijske homoni-mije na transformacijskoj razini. Nejednoznacnost gramaticke relacije u (49) posljedicaje cinjenice da se odnos “shoot – hunters” razlikuje u dvije temeljne jezgrene recenice.Opisana nejednoznacnost ne postoji u slucaju (50) i (51) jer “they growl lions” i “flowersraise” nisu gramaticne recenice jezgre.

Postoji mnogo primjera slicne opce vrste ( [3], [2]) koji, po mojem misljenju, pruzajuuvjerljiv dokaz prikladnosti transformacijske koncepcije kao lingvisticke strukture, kaoi za razmatranje opisano u odjeljku 5.4 da transformacijska analiza omogucava dje-lomicno reduciranje problema objasnjavanja nacina razumijevanja recenice u problemobjasnjavanja nacina razumijevanja jezgrene recenice.

Ukratko, predstavljeni model jezika ima malu, vjerojatno konacnu, jezgru osnovnihrecenica s fraznom strukturom opisanom u 3. poglavlju, te mu je pridruzen skup tran-sformacija koje mogu biti primijenjene na recenice jezgre ili na prethodne nizove s ciljemgeneriranja novih i kompliciranijih recenica iz osnovnih sastavnica. Vidjeli smo odredenenaznake da bi nam ovaj pristup mogao omoguciti reduciranje kompleksnosti stvarnogjezika, i dodatno, pruziti vrijedan uvid u stvarnu upotrebu i razumijevanje jezika.

Literatura

[1] Noam Chomsky. Tranformational Analysis. PhD thesis, University of Pennsylvania,1955.

[2] Noam Chomsky. Syntactic structures. De Gruyter, 1957.

[3] Noam Chomsky. The logical structure of linguistic theory, 1975.

[4] Zellig S Harris. Discourse analysis. Language, 28(1), 1952.

[5] Willard Van Orman Quine. Mathematical Logic... Revised edition. Harvard Univer-sity Press, 1951.

[6] Paul C Rosenbloom. The elements of mathematical logic. Dover Publications, 1950.

[7] Claude Elwood Shannon. A mathematical theory of communication. Bell systemtechnical journal, 27(3):379–423, 1948.

27Pogledati biljesku 26. na str. 20.

22