egy általános modellnek megfelelo szerkezetek kinyerése ... · a vonzatos komplex igÉk...

44
Magyar igei szerkezetek Általánosítás E GY ÁLTALÁNOS MODELLNEK MEGFELEL ˝ O SZERKEZETEK KINYERÉSE KORPUSZBÓL Sass Bálint [email protected] MTA Nyelvtudományi Intézet Budapest, 2011. június 16. 1 / 33

Upload: others

Post on 31-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

EGY ÁLTALÁNOS MODELLNEK MEGFELELO

SZERKEZETEK KINYERÉSE KORPUSZBÓL

Sass Bá[email protected]

MTA Nyelvtudományi IntézetBudapest, 2011. június 16.

1 / 33

Page 2: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

2 / 33

Page 3: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

3 / 33

Page 4: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

4 / 33

Page 5: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

BEVEZETO – JELENTOSÉG

PÉLDÁK

‘részt vesz vmiben’, ‘beleüti az orrát vmibe’, ‘szó van vmirol’,‘hasznot húz vmibol’, ‘kétségbe von vmit’, ‘kockán forog vmi’,‘górcso alá vesz vmit’. . .

Mik ezek?Vonzatos komplex igék:kollokációk és vonzatkeretek egyszerre

gyakoriak, sokszor idiomatikus jelentéssel

lexikai adatbázisba kellenek:tanulói szótárba és nyelvtechnológiai alkalmazások(pl.: gépi fordító) háttér-adatbázisába egyaránt

5 / 33

Page 6: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE

szerkezet LKB LSzB‘részt vesz vmiben’, -t -bAn‘beleüti az orrát vmibe’, -t -bA‘szó van vmirol’, ∅ -rÓl‘hasznot húz vmibol’, -t -bÓl‘kétségbe von vmit’, -bA -t‘kockán forog vmi’, -n ∅‘górcso alá vesz vmit’ alá -t

lexikálisan kötött bovítmény (LKB)lexikálisan szabad bovítmény (LSzB)

A kollokátumot és a vonzatotugyanazok a nyelvi eszközök – esetrag, névutó – jelölik.

6 / 33

Page 7: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE

A kollokátumot és a vonzatotugyanazok a nyelvi eszközök – esetrag, névutó – jelölik.

Egy igén „belül” is elofordul a szerepek felcserélodése:

szerkezet LKB LSzB‘pillantást vet vmire’ -t -rA‘szemére vet vmit’ -rA -t

Feladat: ezek szétválasztása, az LKB-k, LSzB-k azonosítása.

7 / 33

Page 8: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

KÖVETELMÉNYEK

→ Egy olyan lexikai kinyero eljárásra van szükség, mely. . .

képes korpusz alapján az igei szerkezeteket azonosítani;

képes felismerni, elkülöníteni, hogymikor melyik esetrag melyik szerepnek felel meg:azaz melyik bovítmény LKB és melyik LSzB;

egyszerre állapítja mega kollokátumokat és a vonzatokat,így teljes szerkezeteket eredményez.

Következmény: Az algoritmus LKB-ket és LSzB-ket tetszolegeskombinációban tartalmazó szerkezeteket szolgáltat:így kollokációkat (csak LKB) és vonzatkereteket (csak LSzB) is.

8 / 33

Page 9: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

MODELL

szerkezetmodell:szerkezet = ige + bovítményekbovítmény = viszonyjelölo + tartalmi elem

ige

t. e. t. e.

viszony

tart

igény

viszony −rA−t

egyúttal tagmondatmodell is:1 tagmondat ∼ 1 igei szerkezet

tagmondat-reprezentáció: csak LKB!

pl.: ‘India egész Kasmírra igényt tart.’9 / 33

Page 10: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

10 / 33

Page 11: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A KORPUSZTÓL A SZERKEZETEKIG

tevékenység anyag példa

korpusz ‘Vess egy pillantást a térképre.’

tagmondatra bontás ↓szintaktikai elemzésige=vet

reprezentáció -t=pillantás-rA=térkép

jellegzetes igei ↓szerkezetek kinyerése

igei szerkezetek ‘pillantást vet vmire’

→ Igei szerkezetek szótára

11 / 33

Page 12: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ALGORITMUS VÁZLATA

1 Vesszük a korpusz tagmondatait a reprezentáció szerint.Maximum két bovítmény esetén: váltakozó törlés‘Társasház jön létre.’ (ige=jön -∅=társasház -rA=lét)→‘társasház jön létre’, ‘∅ jön létre’, ‘társasház jön -rA’, ‘∅ jön -rA’.

2 Hossz szerint csökkeno sorba rendezés.Hossz (h) = |LSzB| + |LKB|·2

3 A leghosszabbtól kezdve sorra elhagyjuka ritka (f < 5) szerkezeteket.Az elhagyott szerkezetek gyakoriságát az elso olyanrövidebb keret gyakoriságához adjuk hozzá, melyilleszkedik az eredeti keretre.pl.: ‘társasház jön létre’ (h = 4)→ ‘vmi jön létre’ (h = 3)

4 Visszaellenorzés (köv. dia)5 A megmaradó szerkezetek gyakorisági érték szerint

rendezett listája adja az összegyujtött igei szerkezeteket.

12 / 33

Page 13: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ALGORITMUS VÁZLATA

1 Vesszük a korpusz tagmondatait a reprezentáció szerint.Maximum két bovítmény esetén: váltakozó törlés‘Társasház jön létre.’ (ige=jön -∅=társasház -rA=lét)→‘társasház jön létre’, ‘∅ jön létre’, ‘társasház jön -rA’, ‘∅ jön -rA’.

2 Hossz szerint csökkeno sorba rendezés.Hossz (h) = |LSzB| + |LKB|·2

3 A leghosszabbtól kezdve sorra elhagyjuka ritka (f < 5) szerkezeteket.Az elhagyott szerkezetek gyakoriságát az elso olyanrövidebb keret gyakoriságához adjuk hozzá, melyilleszkedik az eredeti keretre.pl.: ‘társasház jön létre’ (h = 4)→ ‘vmi jön létre’ (h = 3)

4 Visszaellenorzés (köv. dia)5 A megmaradó szerkezetek gyakorisági érték szerint

rendezett listája adja az összegyujtött igei szerkezeteket.

12 / 33

Page 14: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

4.

1.

2.

3.

−trészvesz röpcédulázás−bAn

vesz

vesz

vesz

röpcédulázás−bAn −t

−bAn rész−t

−bAn −t

(a)

(b)(c)

(d)

[f = 1]

[f < 5]

hossz

4

3

3

2

13 / 33

Page 15: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A KORPUSZTÓL A SZERKEZETEKIG

tevékenység anyag példa

korpusz ‘Vess egy pillantást a térképre.’

tagmondatra bontás ↓szintaktikai elemzésige=vet

reprezentáció -t=pillantás-rA=térkép

jellegzetes igei ↓szerkezetek kinyerése

igei szerkezetek ‘pillantást vet vmire’

→ Igei szerkezetek szótára

14 / 33

Page 16: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

15 / 33

Page 17: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

16 / 33

Page 18: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

NYELVFÜGGETLENSÉG

Állítás: a modell nyelvfüggetlen.A magyaron kívül számos nyelvre eloállítható a modell szerintireprezentáció, és kinyerhetok a fenti típusú igei szerkezetek.

Reprezentáció eloállítása: viszonyjelölok meghatározása

→ dán és szerb: elöljárók, alany és tárgy esetén sorrendiség

dán példa: ‘have brug for’= szüksége van vmire

szerb példa: ‘ici u prilog’= támogat („haszonba megy”)

obj for

have

brug

17 / 33

Page 19: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

18 / 33

Page 20: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL

A kinyero algoritmus muködésének feltétele: pusztána fenti gráfstuktúrának megfelelo formájú reprezentáció.

Megtehetjük tehát, hogy elvonatkoztatunk az eddigi tartalomtól,és egyéb szerkezeteket próbálunk meg ebben a struktúrábanreprezentálni.

orr

beleüt

−t −bA

bovítmény → jegyviszonyjelölo → él vagy címketartalmi elem → csomópont

19 / 33

Page 21: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL ALKALMAZÁSA 1/3

Névszói csoporttól különbözo bovítmények kezelése.

Fonévi igenév bovítmény.

fni

→ ‘kell csinálni’, ‘kell leperkálni’ . . .

Határozószó bovítmény.

adv

→ ‘mindig akad’, ‘együtt él’ . . .

Helyhatározó, idohatározó hasonlóan kezelheto,ha van ilyen annotáció a korpuszban.

20 / 33

Page 22: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL ALKALMAZÁSA 2/3

Nem ige-központú szerkezetek kezelése:jellegzetes fonévi csoportok kinyerése.

Jegyek:jelzo, fonév esete, fonév száma, fonév birtokos személyragja→ ‘saját lábán’, ‘száraz lábbal’, ‘belso fül’, ‘szabad szemmel’

szem

−vAl

jelzo eset

szabad

Eset megjelenése: él helyett csomópont!21 / 33

Page 23: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3

Többszintu függoségi struktúra kezelése.

Tipikus eset: ige + fonévi bovítmény + fonév jelzoje

a

b

c

d

a c+da+bc

i

j

jk k

i

l

lm m

Visszavezetés az egyszintu modellre: „kisimítás”

22 / 33

Page 24: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3

Többszintu függoségi struktúra kezelése.

Holland példák – részletesen elemzett korpuszból.

holland: ‘ige=speel obj=rol obj+ADJ=belangrijk’magyar: ‘jelentos szerepet játszik’

holland: ‘ige=bewaar in=verpakking in+ADJ=oorspronkelijk’magyar: ‘eredeti csomagolásban tárol’

holland: ‘ige=breng tot=einde tot+ADJ=goed obj’magyar: ‘sikerre („jó befejezésig”) visz vmit’

23 / 33

Page 25: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3

Többszintu függoségi struktúra kezelése.

Holland példák – részletesen elemzett korpuszból.

holland: ‘ige=speel obj=rol obj+ADJ=belangrijk’magyar: ‘jelentos szerepet játszik’

holland: ‘ige=bewaar in=verpakking in+ADJ=oorspronkelijk’magyar: ‘eredeti csomagolásban tárol’

holland: ‘ige=breng tot=einde tot+ADJ=goed obj’magyar: ‘sikerre („jó befejezésig”) visz vmit’

23 / 33

Page 26: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

1 MAGYAR IGEI SZERKEZETEKAlapmodell és reprezentációJellegzetes szerkezetek kinyerése

2 ÁLTALÁNOSÍTÁSNyelvfüggetlenségAbsztrakt modell, alkalmazásokPárhuzamos szerkezetek

24 / 33

Page 27: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

ÖTLET

Párhuzamos korpusz és párhuzamos igei szerkezetek(igei szerkezetek és fordításaik)szintén reprezentálhatók a fenti módon.

Ebbol a reprezentációból a változatlan kinyero eljárásközvetlenül párhuzamos szerkezeteket gyujt.

Hogyan lehet a módszert párhuzamos korpuszra alkalmazni?

Speciális reprezentáció: metakorpusz.

. . . a kétnyelvu korpuszt egynyelvunek „álcázzuk”

25 / 33

Page 28: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

ÖTLET

Párhuzamos korpusz és párhuzamos igei szerkezetek(igei szerkezetek és fordításaik)szintén reprezentálhatók a fenti módon.

Ebbol a reprezentációból a változatlan kinyero eljárásközvetlenül párhuzamos szerkezeteket gyujt.

Hogyan lehet a módszert párhuzamos korpuszra alkalmazni?

Speciális reprezentáció: metakorpusz.

. . . a kétnyelvu korpuszt egynyelvunek „álcázzuk”

25 / 33

Page 29: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A METAKORPUSZ KIALAKÍTÁSA

korpusz: Dutch Parallel Corpus, holland–francia (3,5 mió token)elemzés: nyelvenként külön, tagmondatra bontás és részlegesszintaktikai elemzés egyszeru szabályokkal

1 Tagmondat-szintu illesztés: a tagmondatokat fordításiegységenként sorra egymáshoz rendeltük.

2 Az egymáshoz rendelt tagmondatok holland ill. franciaigéjébol: igepár. (pl.: ‘gaan×aller’ ’megy’)

3 A tagmondatpárban található bovítményeket (mindkétnyelvueket) egy halmazként soroltuk fel az igepár mellett.

holland tagmondat: ‘Ze geloofde in de grote liefde.’francia tagmondat: ‘Elle croyait au grand amour.’

magyar fordítás: ’Hitt a nagy szerelemben.’reprezentáció: ige=geloven×croire innl=liefde àfr=amour

26 / 33

Page 30: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A METAKORPUSZ KIALAKÍTÁSA

Visszavezetés az eredeti modellre: „összefésülés”

a

a

croire

subj in subj

ze liefde elle amour

geloven

ze liefde elle amour

in subjfrnlnlsubj fr

geloven croire

27 / 33

Page 31: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A MÓDSZER ALKALMAZÁSA KÉT NYELVRE

tevékenység holland franciakorpusz korpusz

‘Ze geloofde in de grote liefde.’ ‘Elle croyait au grand amour.’elemzés ↓ ↓

reprezentáció reprezentációige=geloven in=liefde ige=croire à=amour

metakorpusz ↘ ↙kialakításametakorpusz

ige=geloven×croire innl=liefde àfr=amour

kinyerés ↓párhuzamos igei szerkezetekige=geloven×croire innl àfr

szétbontás ↙ ↘‘geloven in’ ‘croire à’

28 / 33

Page 32: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A MÓDSZER ALKALMAZÁSA KÉT NYELVRE

tevékenység holland franciakorpusz korpusz

‘Ze geloofde in de grote liefde.’ ‘Elle croyait au grand amour.’elemzés ↓ ↓

reprezentáció reprezentációige=geloven in=liefde ige=croire à=amour

metakorpusz ↘ ↙kialakításametakorpusz

ige=geloven×croire innl=liefde àfr=amourkinyerés ↓

párhuzamos igei szerkezetekige=geloven×croire innl àfr

szétbontás ↙ ↘‘geloven in’ ‘croire à’

28 / 33

Page 33: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

A MÓDSZER ALKALMAZÁSA KÉT NYELVRE

tevékenység holland franciakorpusz korpusz

‘Ze geloofde in de grote liefde.’ ‘Elle croyait au grand amour.’elemzés ↓ ↓

reprezentáció reprezentációige=geloven in=liefde ige=croire à=amour

metakorpusz ↘ ↙kialakításametakorpusz

ige=geloven×croire innl=liefde àfr=amourkinyerés ↓

párhuzamos igei szerkezetekige=geloven×croire innl àfr

szétbontás ↙ ↘‘geloven in’ ‘croire à’

28 / 33

Page 34: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – ASZIMMETRIA

eredmény: aszimmetrikus szerkezetek

GYENGE (TARTALMI) ASZIMMETRIA

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

EROS (FORMAI) ASZIMMETRIA

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’

‘zijn van toepassing op’ = ‘appliquer se à’ ’vonatkozik vmire’

29 / 33

Page 35: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – ASZIMMETRIA

eredmény: aszimmetrikus szerkezetek

GYENGE (TARTALMI) ASZIMMETRIA

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

EROS (FORMAI) ASZIMMETRIA

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’

‘zijn van toepassing op’ = ‘appliquer se à’ ’vonatkozik vmire’

29 / 33

Page 36: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – ASZIMMETRIA

eredmény: aszimmetrikus szerkezetek

GYENGE (TARTALMI) ASZIMMETRIA

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

EROS (FORMAI) ASZIMMETRIA

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’

‘zijn van toepassing op’ = ‘appliquer se à’ ’vonatkozik vmire’

29 / 33

Page 37: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – SZINONIMÁK

eredmény: szinonimák

adott szerkezet több megfeleloje + gyakorisági viszonyokkal

‘agir se de’ ’szó van róla, szóban forog, illeti, vonatkozik’szerkezet négy fordítása:

holland megfelelo gyakorisági érték‘gaan om’ 114‘zijn OBJ’ 69‘betreffen OBJ’ 27‘gaan over’ 24

→ lexikográfiai felhasználás→ gépi fordítás: további szabályokat lehet tanulni, hogy

melyik fordítás milyen feltételek mellett alkalmazandó30 / 33

Page 38: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – IDIOMATIKUS MEGFELELOK

eredmény: idiomatikus megfelelok

IGÉK

‘maken deel van’ = ‘faire partie de’ ’részét képezi vminek’

‘doen beroep op’ = ‘faire appel à’ ’támaszkodik vmire’

ELÖLJÁRÓK

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’‘doen beroep op’ = ‘faire appel à’ ’fellebbez vkihez’‘hebben effect op’ = ‘avoir effet sur’ ’hatása van vmire’

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

31 / 33

Page 39: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – IDIOMATIKUS MEGFELELOK

eredmény: idiomatikus megfelelok

IGÉK

‘maken deel van’ = ‘faire partie de’ ’részét képezi vminek’

‘doen beroep op’ = ‘faire appel à’ ’támaszkodik vmire’

ELÖLJÁRÓK

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’‘doen beroep op’ = ‘faire appel à’ ’fellebbez vkihez’‘hebben effect op’ = ‘avoir effet sur’ ’hatása van vmire’

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

31 / 33

Page 40: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – IDIOMATIKUS MEGFELELOK

eredmény: idiomatikus megfelelok

IGÉK

‘maken deel van’ = ‘faire partie de’ ’részét képezi vminek’

‘doen beroep op’ = ‘faire appel à’ ’támaszkodik vmire’

ELÖLJÁRÓK

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’‘doen beroep op’ = ‘faire appel à’ ’fellebbez vkihez’‘hebben effect op’ = ‘avoir effet sur’ ’hatása van vmire’

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

31 / 33

Page 41: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

PÉLDÁK – IDIOMATIKUS MEGFELELOK

eredmény: idiomatikus megfelelok

IGÉK

‘maken deel van’ = ‘faire partie de’ ’részét képezi vminek’

‘doen beroep op’ = ‘faire appel à’ ’támaszkodik vmire’

ELÖLJÁRÓK

‘nemen deel aan’ = ‘participer à’ ’részt vesz vmiben’‘doen beroep op’ = ‘faire appel à’ ’fellebbez vkihez’‘hebben effect op’ = ‘avoir effet sur’ ’hatása van vmire’

‘houden van’ = ‘aimer OBJ’ ’szeret vmit’

31 / 33

Page 42: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

ÖSSZEFOGLALÁS 1/2

Sokféle szerkezet reprezentációja megfogalmazható abemutatott absztrakt modellben, így ez az általános keret aváltozatlan kinyero eljárással együttmuködve számos típusújellegzetes szerkezet kinyerésére alkalmassá teheto.

igei szerkezetek névszói csoport bovítményekkelegyéb bovítményekkeljellegzetes névszói csoportoktöbbszintu szerkezetekpárhuzamos szerkezetek

32 / 33

Page 43: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

ÖSSZEFOGLALÁS 2/2

Párhuzamos korpuszra alkalmazva a módszer kétnyelvu igeiszerkezetek hasznos gyujteményét képes eloállítani. Felfedezia formailag egymásra nem hasonlító, de egymásnak megfelelo,egymás fordításaiként kezelendo igei szerkezeteket is.

A módszer egyszerre rendelkezik az alábbi tulajdonságokkal:igei kollokációkinyerésigei vonzatkeret-megállapításmegszakított és változó szórendu szerkezetek kezelésetöbbnyelvu szerkezetek kinyerése párhuzamos korpuszbólnyelvfüggetlen eljárás

A jövoben hozzájárulhat kétnyelvu szótárak korpuszvezéreltanyaggyujtési munkálataihoz.

Köszönöm a figyelmet!

33 / 33

Page 44: Egy általános modellnek megfelelo szerkezetek kinyerése ... · A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök – esetrag,

Magyar igei szerkezetek Általánosítás

ÖSSZEFOGLALÁS 2/2

Párhuzamos korpuszra alkalmazva a módszer kétnyelvu igeiszerkezetek hasznos gyujteményét képes eloállítani. Felfedezia formailag egymásra nem hasonlító, de egymásnak megfelelo,egymás fordításaiként kezelendo igei szerkezeteket is.

A módszer egyszerre rendelkezik az alábbi tulajdonságokkal:igei kollokációkinyerésigei vonzatkeret-megállapításmegszakított és változó szórendu szerkezetek kezelésetöbbnyelvu szerkezetek kinyerése párhuzamos korpuszbólnyelvfüggetlen eljárás

A jövoben hozzájárulhat kétnyelvu szótárak korpuszvezéreltanyaggyujtési munkálataihoz.

Köszönöm a figyelmet!33 / 33