nowa definicja formalna polskiej frazy nominalnej ipipan * 21.01.2008
Post on 29-Jan-2016
48 Views
Preview:
DESCRIPTION
TRANSCRIPT
NOWA DEFINICJA FORMALNAPOLSKIEJ FRAZY NOMINALNEJ
IPIPAN * 21.01.2008
Prof. dr hab. Marek ŚwidzińskiZakład Językoznawstwa Komputerowego
Instytut Języka Polskiego UWe-mail: m.r.swidzinski@uw.edu.pl Konsultacje: śr 14.00-15.00, pok. 1śr 14.00-15.00, pok. 1
Adres internetowy:www.mswidz.republika.pl
Program
• Cel• Motywacja• (Pre)historia• Dziury i błędy w opisie fno• fno: co to jest?• Format i parametry• Przykładowe reguły• Rozwiązanie I: jałowa rekursja• Rozwiązanie II: realizacje atrybutywne• Rozwiązanie III: opis przecinka• Luźne końce…
–2
Cel
• Prezentacja projektu przebudowy GFJP.• „Łóżko testowe”: opis jednej jednostki składniowej.• Pokaz gotowych rozwiązań kilku problemów
teoretycznych i praktycznych.
–3
Motywacja
• GFJP była / jest testowana ( Świgra).• GFJP musi być poprawiona / rozbudowana (?).
• Dlaczego nie napisać GFJP lepiej?
• Zacząć od jakiejś jednostki składnikowej.• fno:
fraza (jednostka prostsza niż zdaniowa);nominalna (jednostka ważna, częsta w tekstach,
strukturalnie bogata); jednostka „oddolna”.
–4
(Pre)historia (1)
• Szpakowicz, S., Świdziński, M.: Formalna definicja równorzędnej grupy nominalnej we współczesnej polszczyźnie pisanej. Warszawa 1981. 74. Maszynopis powielony. Również w: Studia gramatyczne t. IX, Wrocław 1990. 9-54.
• Świdziński, M.: Gramatyka formalna języka polskiego, Warszawa 1992.
• Świdziński, M., Derwojedowa , M., Rudolf, M.: „A computational account of multi-word numeral phrases in Polish”. Linguistik International Band 10. Investigations into Formal Slavic Linguistics. Contributions of the FDSL IV. Frankfurt am Main i in. 2003. 405-415.
–5
(Pre)historia (2)
• Świdziński, M., Derwojedowa , M., Rudolf, M.: „Two formal approaches to Polish numeral phrases implemented”. Studia z gramatyki i leksykologii języka polskiego. Red. M. Gębka-Wolak, I. Kaproń-Charzyńska, M. Urban. Toruń 2003. 93-108.
• Woliński, M.: Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska. IPI PAN: Warszawa 2005.
• Świdziński, M.: „A DCG account of Polish relative constructions”. [W:] Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 3rd L&T Conference, October 5-7, 2007, Poznań, Poland. Poznań 2007. 478-482.
–6
(Pre)historia (3)
• Świdziński, M., Woliński, M.: „Towards a new version of the formal grammar of Polish: the NP redefined”. [W:] Formal Description of Slavic Languages FDSL-7. University of Leipzig, 30 November – 2 December, 2007. Book of Abstracts, Leipzig 2007. 101-103.
–7
Dziury i błędy w opisie fno (1)
• Brak definicji fraz z koordynacją.• Brak definicji fraz z liczebnikiem.• Brak definicji fraz liczebnikowych.• ………….
–8
Dziury i błędy w opisie fno (2)
Są to także błędy ogólne!!!
1. Mechanizm jałowej rekursji.2. Realizacja przymiotnikowa fno.3. Opis przecinka.
–9
Dziury i błędy w opisie fno (3)
1. Jałowa rekursja
• Hierarchia kanoniczna:
– Fraza nominalna (FNO)– Konstrukcja nominalna z dopełniaczem (KNODOP)– Konstrukcja nominalna z frazą przyimkową (KNOPM)– Konstrukcja nominalna z atrybutem (KNOATR)– Konstrukcja nominalna z inkorporacją (KNOINK)– Konstrukcja nominalna (KNOM)
–10
Dziury i błędy w opisie fno (4)
- FNO = KNODOP FZD- KNODOP = KNOPM FNO- ……………..- KNOM = FNO
• KNOM (p, rl, o, neg, z, kl)= FNO (p, rl, o, neg, NI, z, kl). (NO48)
–11
Dziury i błędy w opisie fno (5)
2. Realizacja przymiotnikowa fno
- FNO = KNODOP FZD- KNODOP = KNOPM FNO- ……………..- KNOATR = FPT- ……………..
KNOATR (p, rl, 3, neg, i, z, kl)
= FPT (p, rl, st, neg, i, z, kl). (NO38)
–12
Dziury i błędy w opisie fno (6)
3. Opis przecinka
• Przecinek jako jednostka składniowa – duży problem ogólny:
- wielofunkcyjność słowa ,- wielomotywacyjność wystąpień przecinka
ortograficznego- opcjonalność w pewnych kontekstach
• W GFJP – przecinek pusty międzyspójnikowy:
% Wiem, że jeśli przyjdą, umrę.% * Wiem, że, jeśli przyjdą, umrę.
–13
fno: co to jest? (1)
• Występuje jako realizacja lub składnik:– frazy wymaganej,– frazy luźnej,– frazy przyimkowo-nominalnej,– frazy nominalnej (w szczególności skoordynowanej),– frazy przymiotnikowej.
–14
fno: co to jest? (2)
• Ma różne struktury:– współrzędną– podrzędną– egzocentryczną
• Ma różne centra:– rzeczownikowe– liczebnikowe– zaimkowe różnych typów– przymiotnikowe (?)– gerundialne (?)
–15
fno: co to jest? (3)
• Ma bogaty zestaw cech gramatycznych:– przypadek– rodzaj– liczba– osoba– klasa (centrum)
……..
• Gęsta sieć uzgodnień wewnętrznych i zewnętrznych
–16
Format i parametry (1)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz])
fnokoor(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz, Sp])
–17
Format i parametry (2)
• P przypadek• R/L rodzaj i liczba• O osoba• Neg negacja• I inkorporacja: bowiem, natomiast, więc, zaś,
ni, bp; R/L• Pnw pytajno-niepytajność: npyt, pyt, pz, wz• Kl klasa: rzecz, os, co, kto, który, jaki, nuzg, uzg• Tak taktylowatość: tk, tyle• Sub nad-podrzędność: na, po• Pk przecinkowość końcowa: bp, stan• Poz pozycja: pre, post, egz• Sp oznaczenie spójnika
–18
Format i parametry (3)
• Porządek zapisu reguł:
Pnw dowolnePnw = pytPnw = npytPnw = wzPnw = pz
–19
Przykładowe reguły (1)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).
% Chłopiec, którego znam, [umarł.]% Chłopiec, którego znam [, który umarł, nie przyjdzie.]
–20
Przykładowe reguły (2)
fno(mian, nij/poj, 3, Neg, I, pyt, licz, Tak, Sub, Pk) --> s(no#),
fpt(mian, R/L, St, Neg1, I1, Pnw1, Kl1, Tak1, po, Pk1), { oblink(I, I1, I2), oblink(I, I2, I3), oblnegf(Neg, Neg1, Neg2) },flicz(mian, R/L, O, Neg2, I2, Pnw2, nuzg, Tak2, na, Pk2), fno(dop, R/L, O, Neg3, I3, Pnw3, Kl3, Tak3, po, Pk),{ rozne(R, mos), rowne(pyt, Pnw1.Pnw2), rowne(Pnw1, npyt.pyt), rowne(Pnw2, npyt.pyt), rowne(Pnw3, npyt.pyt), obltak(Tak, Tak1, Tak2), rozne(Kl3, licz), obltak(Tak, Tak2, Tak3) }.
% Które pięć facetek [było zaproszonych?]
% Te pięć z której klasy facetek [przyszło?]–21
Rozwiązanie I: jałowa rekursja
fno przec spoj fnofno spoj fnospoj fno przec spoj fno
fnokoor
fno fzd <flicz fno><fno fno(dop,...)><fno fpm><fno fpt>fno(...,I,...) spoj(Tsp, I, ni)
fno bez podrzędnika [różne realizacje]:
formarzecz, zaimpyt, zaimwzg, zaimos,...–22
Rozwiązanie II: realizacje atrybutywne (1)
• Nie ma takiej realizacji ogólnej!!!• Zamiast niej – wyliczanka realizacyj szczegółowych:
Pnw dowolne:
Przymiotnik
fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),
fpt(P, R/L, St, Neg, I, Pnw, Kl, Tak, na, Pk),{ rowne(St, wyz.naj) }.
% Nowszą od czego [czytano?]% Najnowszej [nie czytano.]
–23
Rozwiązanie II: realizacje atrybutywne (2)
Liczebnik porządkowy fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),
flicz_porz(P, R/L, Neg, I, Pnw, Kl, Tak, na, Pk). % Drugiego [widziałem.]
–24
Rozwiązanie II: realizacje atrybutywne (3)
Zaimek przymiotny
fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),
fno_zaim_przym(P, R/L, Neg, I, Pnw, Kl, Tak, Sub, Pk). % Każdą [lubiłem.]% [Nie znam] żadnej [.]
Jest osobna definicja fno_zaim_przym
–25
Rozwiązanie II: realizacje atrybutywne (4)
Pnw = wz
fno(P, R/L, 3, Neg, I, wz, Kl, Tak, Sub, Pk) --> s(no#),
przyimek(Forma, dop),{ rowne(Forma, z.spośród) },fno(dop, R/mno, O, Neg1, I1, wz, Kl1, Tak1, po, Pk1), { oblnegf(Neg, Neg1, Neg2), oblink(I, I1, I2), obltak(Tak, Tak1, Tak2) }, fno_zaim_przym(P, R/L, Neg2, I2, Pnw2, Kl2, Tak2, na, Pk).
% [Książek, ] z których żadnej [nie znam, nie czytano.]
–26
Rozwiązanie III: opis przecinka (1)
• Problem:
% Chłopiec, którego znam, umarł.% * Chłopiec, którego znam umarł.% Umarł chłopiec, którego znam.% * Umarł chłopiec, którego znam,.% Chłopiec, którego znam, który umarł, nie przyjdzie.% Chłopiec, którego znam,, który umarł, nie przyjdzie.
–27
Rozwiązanie III: opis przecinka (2)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#),
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).
Jednostki zawierające przec lub spoj(przec,…)
• zdanie (koordynacja!!!)• fw• fl• fno• fpt• fzd
–28
Rozwiązanie III: opis przecinka (3)
• W regułach definiujących te jednostki składnik przedprzecinkowy / przedspójnikowo-przecinkowy X dostaje wartość bpk.
• W regule definiującej wypowiedzenie jednostka zdanie ma wartość bpk.
• Wewnątrz X wartość ta spada na składnik końcowy.
• Dla X = fzd są dwie realizacje:- stan – z przec na końcu- bpk – bez przec na końcu
• Dla X będącego frazą bez przecinka każda realizacja jest stan.
–29
Rozwiązanie III: opis przecinka (4)
% Chłopiec, którego znam [Pk = stan], umarł. % * Chłopiec, którego znam umarł.% Umarł chłopiec, którego znam [Pk = bpk].% * Umarł chłopiec, którego znam,.% Chłopiec, którego znam [Pk = bpk], który umarł, nie
przyjdzie.% Chłopiec, którego znam,, który umarł, nie przyjdzie.
–30
Rozwiązanie III: opis przecinka (5)
• Problem przecinka początkowego: rozwiązany przez parametr I (?).
% Kto pyta, nie błądzi.% * , Kto pyta, nie błądzi.
• Pozostaje problem opisu braku przecinka wewnątrz fzd o pierwszym składniku będącym fzd:
% Wiem, że kto pyta, nie błądzi.% * Wiem, że, kto pyta, nie błądzi.
–31
Luźne końce… (1)
• Definicja frazy liczebnikowej (banał…).• Porządna definicja fno z koordynacją.• Opis fno egzocentrycznej:
% Chłopiec i dziewczyna [przyszli.] egz% My i dziewczyna [przyszliśmy.] egz% [Przyszli] chłopiec i dziewczyna [.] egz% [Przyszliście] chłopiec i wy [.] egz % [Przyszedł] chłopiec i dziewczyna [.] post% [Przyszedł] chłopiec i ktoś jeszcze [.] post% [Przyszedł] chłopiec i dwie dziewczyny [.] post% [Przyszedł] chłopiec i pięć dziewczyn [.] post
–32
Luźne końce… (2)
% Chłopiec i ktoś jeszcze [przyszedł.] pre% Chłopiec i dwie dziewczyny [przyszły.] pre % Chłopiec i pięć dziewczyn [przyszło.] pre
Ale także:
% naszych Jasia i Marysi % kochane Joasiu i dziewczyny% tymi filozofią i matematyką
–33
Dziękuję za uwagę!!!
–34
top related