sanda cherata, teodor vu$can, emma tavannu · derivat din verb prin sufixul :/or, s-au flcut...

13
SANDA CHERATA, TEoDoR VU$CAN, EMMA TAvAnNu SILEX - FUNCTIILE DE LEMATIZARE $I DE GENERARE A PARADIGMELOR Considerafii introductive Cele de fald reprezintd al doilea articolt din seria dedicatd prezentdrii sistemului lexico-morfologic computerizat pentru analiza textelor romdneqti (SILEX), sistem realizalin cadrul unei colabordri ample intre un colectiv de la S.C. Software ITC S.A. si Centrul de Analizl a Textului de la Facultatea de Litere a Universitd[ii,,Babeg-Bolyai". Precizdri terminologice. formd = unitate grafrcd ce corespunde unit5[i lingvistice 'cuvint-ocurenld'; lemd - unitate lexicald, reprezentat6 in rnod conven{ional printr-o formd de bazd (exemplu infinitivul prezeni activ al verbului, nominativul singular nearticulat al substantivului etc.) si apartenen{a ei la o anumiti clasd lexico-gramatical[; rdddcind = sirul de caractere invariant in cursul flexiunii (pentu inteaga paradigmi sau doar pentru o part€ a acesteia); Sjnv = segmentul de cuvdnt comun (invariant al) unei p[r{i a ' paradigmei, prezent sub forml de cemp al intr[rii din dicfionar corespunzdtoare unei leme: terminafie : qirul de caractere ce se adaugi 'rdddcinii'pentru a obline o formd flexionatd a cuvintului. Dic{ionarul SiLEX a fost descris pe larg (intrdri debazA, atribute, struchrare intem6, optimizdri, aplicalii) in primul articol; cel de fafi se focalizeazd asupra componentei dinamice, adicd asupra modutelor de lematizare ;i de generare a paradigmelor. In conceperea qi rcalizarea celor dou6 module, autorii au incorporat sugestii din bibliografra de specialitate (vezi Sursele bibliografice), insd produsul igi p6strezd un marcat caracter de originalitate in spaliul prelucrSrii automate a textelor romdnegti, nu doar sub aspectul sdu strict informatic, ci ;i in ce priveqte solu{iile de formalizare a descrierii lingvistice. 1. Procesul de lematizare Lematizarea reprezinti procesul prin care fiecare formd ocurenti inh-un text este incadrat6 lemei sale. Sistemul SILEX este astfel conceput incAt permite, I Yezi SILEX - Un sistem lexico-morfologic anmputerizat pentru'unalizu textektr romdne;ti, in ,,Dacoromania", serie noui, I, 1994-1995,w. l-2. DAC\RoMANIA serie noud, II, 1996-1997, Cluj-Napocu, p. 273-21t5

Upload: others

Post on 16-Sep-2019

22 views

Category:

Documents


0 download

TRANSCRIPT

SANDA CHERATA, TEoDoR VU$CAN, EMMA TAvAnNu

SILEX - FUNCTIILE DE LEMATIZARE $I DEGENERARE A PARADIGMELOR

Considerafii introductiveCele de fald reprezintd al doilea articolt din seria dedicatd prezentdrii

sistemului lexico-morfologic computerizat pentru analiza textelor romdneqti(SILEX), sistem realizalin cadrul unei colabordri ample intre un colectiv de laS.C. Software ITC S.A. si Centrul de Analizl a Textului de la Facultatea deLitere a Universitd[ii,,Babeg-Bolyai".

Precizdri terminologice. formd = unitate grafrcd ce corespunde unit5[ilingvistice 'cuvint-ocurenld'; lemd - unitate lexicald, reprezentat6 in rnodconven{ional printr-o formd de bazd (exemplu infinitivul prezeni activ alverbului, nominativul singular nearticulat al substantivului etc.) si apartenen{aei la o anumiti clasd lexico-gramatical[; rdddcind = sirul de caractereinvariant in cursul flexiunii (pentu inteaga paradigmi sau doar pentru o part€a acesteia); Sjnv = segmentul de cuvdnt comun (invariant al) unei p[r{i a' paradigmei, prezent sub forml de cemp al intr[rii din dicfionarcorespunzdtoare unei leme: terminafie : qirul de caractere ce se adaugi'rdddcinii'pentru a obline o formd flexionatd a cuvintului.

Dic{ionarul SiLEX a fost descris pe larg (intrdri debazA, atribute, struchrareintem6, optimizdri, aplicalii) in primul articol; cel de fafi se focalizeazd asupracomponentei dinamice, adicd asupra modutelor de lematizare ;i de generare a

paradigmelor. In conceperea qi rcalizarea celor dou6 module, autorii au

incorporat sugestii din bibliografra de specialitate (vezi Sursele bibliografice),insd produsul igi p6strezd un marcat caracter de originalitate in spaliul prelucrSriiautomate a textelor romdnegti, nu doar sub aspectul sdu strict informatic, ci ;i ince priveqte solu{iile de formalizare a descrierii lingvistice.

1. Procesul de lematizareLematizarea reprezinti procesul prin care fiecare formd ocurenti inh-un text

este incadrat6 lemei sale. Sistemul SILEX este astfel conceput incAt permite,

I Yezi SILEX - Un sistem lexico-morfologic anmputerizat pentru'unalizu textektr romdne;ti,in ,,Dacoromania", serie noui, I, 1994-1995,w. l-2.

DAC\RoMANIA serie noud, II, 1996-1997, Cluj-Napocu, p. 273-21t5

214 SANDACTIERATA, TEODORVU$CAN, EMMATAMAIANU

pentru fiecare lem6, determinarea tuturor formelor ce apa(in paradigmci sale,

prin intcrmcdiul unui mccanism carc nu presupune inregistrarca' f1p;icd .a

iormelor. Lematizarea formelor este procesul prin care se realizeazd funclia

inversS: fiind datb o form[, se determind lema (lemele) in a clrei (c[ror)paradigmd apare fonnq in cauzd; concomitent cu determinarea acestor leme, se

regdsesc qi atributele aferente formei. l

Observalie. Convenim cI paradigma unu! cuvint nellexibil constii dintr-o

singurd form6, coincidenti cu lema.

Procesul de lematizare va furniza, pentru fiecare form6; urmdtoarele

rezultate: .l

- lema, adicd reprqzentantul pqradigmei cuvantului; - :

* clasa lexico-gramaticale a cuvantului (substantiv,'adjectiv, verb etc.);

- subclasa lexico-gramaticald, dacd este,cazul (substantiv propriu sau:ggql.un,

verbpredicativ'auxiliarsaucopulativetc.);* ln cazul cuvintelor flexibile, se stabilesc in plus ctilelalte dete4mindri,

dependente de clasa morfologicd:

- pentru substantive qi adjective: gen, numdr, caz; ' \

-pentruverbe: mod,timp,persoand,numdr; :'

- pentru pronume:/elul pronumelui, gen, numdr, caz, persoand;

- pentru numerale:/elul numeralului, gen, caz (unde existd).

Precizire. ln versiunea actuald, analiza formelor Se face strict icontextual,furnizindu-se, pentru tiecare ocurenff, a unei forme, toate incadririle morfologiceposibile, adicd toate lemele in paradigma clrora apare fonna respectivd,. impreund cu

atributele aferente formei flexionate. De exemplu, pentru forma pard,; reztitateleprocesului de lematizare sunt urmdtoarele:

- paril,substantiv, feminin, singular, nominativ/acuzativ;- par, adjecliv, l'eminin, singular, nominativ/acuza-tiv;

- a piirea, verb, conjunctiv, prezent, persoana a III-4, singular;* a para, verb, indicativ, perf'ect sirnplu, persoana a III.a, singular.

Obsen'agie. Pentru situa{iile de omonimie gramatical[ in interiorul aceleiaqi

paradigme se ahqeazi numai una dinte valorile categoriilor implicate inomonimie, gi anume cea care apare prima in ordonarea uzuald din lucrdrile de

morfologie. (Vezi, de exemplu, in Anexa 1: pentru forma verbald pustii, se

afiqeazdvaloarea'infinitiv', nu qi valoarea'indicativ, perfect simpl -u'.)

1. 1. Metoda utilizati in procesul de lematizare ::

Textul de prelucrat poate fi introdus fie de la terminat, fie dintr-un fiqier. Se

preia o linie a textului sursd s,i se lematizeazi pe rind fiecare cuvdnt. ,, .

in procesul de lematizare, pentru fiecare cuvint de prelucr-at se fac-toatedescompunerile posibile in doud pdrli:

CUvdnt=f *t i i:, : :,:.. :i

stLEx - FUNCTilLE DE LEMATIZARE $l DE GENERARE A PARADTGMELOR 2"15

unde r corespunde unei eventuale r6dlcini (parte invarianti in cadrulparadigmei), iar t corespunde unei eventuale terminalii a cuvAntului. indescompunerea ini1ial6, t este girul vid,

Pentru fiecare descompunere de acest fel se verificd daci poate fi'gisiE olemd care s6-i corespundd. in acest scop, se cauti in dicfionarul SILEX dacd

existd o inhare al cdrei cdmp Slnv coincide cu r. in cazul in care o astfel de

intrare este g5sitd, se verificd dacd t corespunde unei terminalii din lista'determinalii (lst-ter)asociati inhdrii respective din diclionar .in cazafirmativ, se

determind lema qi afibutele aferente terminafiei.Obiervalie.inprincipiu, in dicfionar pot exista mai multe inftdri caresd aibd cimpul Sinv coincident cu r (din cauzi ci acelagi segment

invariant p<late aplrea in paradigma mai multor leme). De aceea,

pentru un r dat se analizeazA toate intririle respective. Pentru hecare

intrare gdsiti se face verificarea terminaliei t, detectindu-se astfeltoate lemele in a ctrror paradigmd apare cuvdntul' dat, lndescampunerea tratatd.

in continuare se incearcd o altii descompunere a cuvfurtului, de forma:. cuvdnt = r, * t,,

unde: r =r.*ntt=r*t,

a fiind ultima literd a lui r, iar r qi t - elementele descompundrii imediat

anterioare, gi se repeti aceleaEi operafii de verificare. Este posibil ca mai multedescompuneri sI fie valide (in cazul formelor omografe). in felul acesta se

determind toate incadrlrile posibile (se identifici toa[e lemele in a clrorparadigmd apare forma in cauzd). Procesul de descompunere se incheie inmomentul in care fie r' este qirul vid, fie t' nu apartine listelor de terminafii.

in vederea imbundtE{irii performan(elor de timp ale metodei de lematizareprezentate mai sus, s-au fbcut o serie de optimizdri at6t (a) in ce priveqte

algoritmul propriu-zis, c6t gi (b) in ce priveEte confinutul diclionarului.Optimizdrile (a), cele privind procesul de descompunere, reduc numdrul de

descompuneri posibile ale unui cuv6nt dat, iar optimiz6rile (b), cele de la niveluldicfionarului, reduc numdrul de rdddcini omografe.

1. 2. Implementarea procesului de lematizare1.2.1. Etape:

(i) se stabilesc op[iunile privitoare la modalitatea de introducere a

textului de analizat, prin dialog cu utilizatorul;. (ii) se inilializeazddatele globale qi se deschid bazele de date;i figierele

utilizate;

276 SANDA CHERAI'A, I'EODOR VU$CAN, EMMA TAMAIANU

(iii) se preia o linie de text 9i se separd cuvintele din linie;(iv) se analizeazd pe rdnd cuvintele din linia de text;

(v) se inscriu rezultatele in fiEierele de rezultate'

l.2.2.Descrierein cclc ccurmeaz[ prezentim detaliat cele mai importante dintre aceste etape.

La lansarea in execulie a programului de recunoaqtere, apare o fereastrd de

dialog in care utilizatorul stabileqte modalitatea de introducere a textului, qi

anume : de la tastaturd sau dintr-un fiEier.

in cazul in care textul este introdus. dintr-un fiEier, rezultatul analizei va fimemorat intr-un fiEier avdnd acelaEi nume ca fiqierul sursd 9i extensia ,,.rec".

Cuvintele nerecunoscute in urma anaiizei vor ft memorate intr-o bazd de date

av|nd acelagi nume ca fiqierul sursd ;i extensia ,n nec". Menfiondm cI aceasti

facilitate este util6 pentru punerea la punct a sistemului de recunoagtere a

formelor.ln continuare se citegte cdte o linie a texflrlui sursd qi se prelucreaz6 cuvintele

liniei unul cite unul. Pentru aceasta, se separd cuvintul analizal lindnd cont de

semnele de punctualie qi de spaliile separatoare. In acest moment se detecteazi

qi daci forma este precedatl sau urmatd de cratimd. Cuvdntul astfel delimitat

este convertit in litere mici, deoarece in dicfionar intr5rile conlin numai astfel de

litere. La conversie se line cont gi de codurile speciale pentru diacritice.

Se trece apoi la recunoqterea cuvintului in cauzd, conform metodei

prezentate sub 1. 1. Pentru aceasta, se incearci intii recunoaqterea cuvflntului

a$a cum este dat, DacI recunoa;terea nu reuqefte se mai fac urmdtoarele

incercdri:a. Se testeazl dacl forma incepe cu unul din prefixele re-' ne-, nemai-,

prefixe foarte productive mai ales pentru riddcinile verbale2. in caz afirmativ,

se incearcS recunoaqterea unui verb sau derivat verbal pornind de la forma dat[,

din care s-a eliminat prefixul. Dacd recunoa$terea a reuqit, se construieEte lema

coresprrnzitoare iuvantului prin ad6ugarea prefixului la lema gdsitd in diclionar.

b. CAnd forma tot nu este recunoscutd, se testeazl dacd este precedatd sau

urmati de cratimd, caz in care aceasta poate semnifica absen{a unei litere. in caz

conform situatiilor de folosire aafirmativ, se incearcd addugarea unei litere,

cratirnei specificate in gramatica limbii romAne qi se incearcd din nou

recunoa;terea.in Anexa I prezentdm un exemplu cu rezultatele analizei unui text real

(poemul Amurg de G. Bacovia).

2 Din motive rje'optimizare a ciutirilor in diclionar, pentru respectiv€le derivate nu exist6

intrlri proprii. Vezi, in acest sens, precedentul nostru articol, sub 2' 2' l'

SILEX - FUNCTIILE DF LEMATIZARE $I DE GENERARE A PARADIGI\4ELOR 277

Precizdri la l. 2.2. (l) Dat fiind numdrul relativ mare, in raport cu ansambluldiclionarului, al lemelor din categoriile: infinitiv lung, adjectiv participial qi adjectivderivat din verb prin sufixul :/or, s-au flcut optimizdri de spaliu ;i timp prin tratareaspeciald a paradigmelor acestor cuvinte, in absenla inhlrilor proprii in dicfionar. (2) Totdin motive de optimizare a spa{iului ;i timpului, in versiunea actuall dictionarulpropriu-zis este implr{it in doua baze de date, dup[ lungimea cuvintelor.

Au fost consecvent respectate cerin[ele de modularizare si de structurareflexibild, incdt acestea sI facn posibile extensii ulterioare.

1. 3. Concluzii privind procesul de lematizareFunclia de lematizare este implementat5 inf-un modul separat (independent)

al sistemului SILEX, penku a asigura astfel posibilitatea de a dezvolta pe bazaei diverse aplicafii de mare actualitate. De pildd, in prezent se afld intr-o fazdavansati de realizare o aplicalie de verificare automatd a textelor rominesti inprivin[a greqelilor de ortografie, aplica{ie deosebit de util5 in activiiateaediturilor. in aceeapi ordine de idei, la Centrul de Analizd a Texnrlui de laFacultatea de Litere a Universitdlii ,,Babeg-Bolyai" se afld in curs deexperimentare un sistem penffu concordanfele textelor poetice romAneqti, sistemcare incolporeazd acest modul de lematizare.

2. Procesul de generare a paradigmei cuvintelor flexibilePrin'proces de generare a patadigmei unei leme date' se inlelege construc{ia

formelor unei paradigme pomind de la reprezentantul ei (lema) gi de la clasalexico-gramaticali. Din cauza omografiilor, aceea;i lemd poate avea paradigmediferite, apar{inind aceleiagi clase morfologice sau unor clase morfologicediferite. Distincfia dintre doui leme omografe care corespund la clasemorfologice diferite se face prin atributul de clasl lexico-gramaticald ataqatlemei gi existent in dic{ionar. Distinclia dintre doud leme omografe carecorespund aceleiaqi clase morfologice se face prin intermediul listei determinafii, ata;ati in diclionar lemei in ca\zd, iar in cazul substantivelordistinclia se face {inind cont gi de atributul gen. Pentru lemele omograf'e avAndaceeagi clasb lexico-gramaticald se vor genera toate paradigmele.

2. l. Metoda utilizatl in procesul de generare a paradigmelorFlexionarea este realizatd ca o opera[ie simetricd fale de lematizare, at6t in

privin{a metodei, cdt Ei in cea a implementirii.Procesul de flexionareutilizeazi urmdtoarele informa{ii existente in bazele

de date ale SILEX:(i) dicfionarul SILEX, ordonat de data aceasta dupd leme, permite asocierea

rapidl qi simpl5 a tuturor paradigmelor corespun4Stoare unei leme date gi uneiclase lexico-gramaticale date; separarea paradigmelor corespunzdtoare aceleiaqileme (cazul omografiilor) se face prin intermediul afibutului'listE de terminalii'ataEat unei paradigme a lemei;

278 SANDACHERATA. TEODORVUSCAN, EMMATAMAIANU

(ii) listele de terminalii structurate pe clase lexico'gramaticale si, in cazulsubstantivului, pe genuri.

Pentru flexionarea unui cuvdnt este necesard, a;adar, precizarea lemei Ei a

clasei ei lexico-gramaticale.2.1.1. EtapeProcesul de flexionare a unui cuv6nt se realizeazilin urmdtoarele etape:

(1) se cauti intrarea de diclionar corespunzdtoare lemei si clasei date;

(2) se re{ine cdmpul Sinv (riddcina), numdrul listei de termina{ii Ei

subparadigma corespunzltoare riddcinii;(3) lindnd cont de subparadigma asociatE r6dlcinii, se construieqte,penffu numdrul curent al listei de terminafii, partea corespunzdtoare dinparadigma cuvtntului, prin ataqarea terminaliilor la r[ddcin6;(4) dacd paradigma nu este generat6 complet, se caufti in continuare oalt6 intrare din diclionar corespunzdtoare lemei, clasei qi listei de

terminafii curente qi se procedeaz}'caryai sus; se repet5 pasul 4 pAnd laoblinerea paradigmei complete; ''

,

Obs. Lasubstantivele gi verbele defective, respectivul fenomen este

iraiai aiat ia nivciui tiic{ionarului, prin informa[ii atieuvaie, cAt;i inprocesul de flexionare, peniru'determinarea exactl a paradigmei.

(5) in eventualitatea omografiilor din cadrul aceleiEi clase morfologice

' se reia procedeul de Ia punctul (l); procesul de ganerare a paradigmelorse incheie dupd ce s-au tratat toate intrdrile din dicgionarcorespunzdtoare lemei qi clasei lexico-gramaticale specificate.

2. 2. Implementarea procesului de flexionareEtape:

(i) se initializeaz6 datele globale qi se deschid bazele de date qi figiereleutilizate; pentru buna func{ionare a procesului de flexionare,informaliile din dicgionar sunt ordonate dupd cdmpul lemi;(ii) se citesc lema qi clasa introduse de utilizator;(iii) se genercado paradigml corespunzdtoare lemei date gi se afiqeaziin foimatul extem care apare in lucr[rile de morfologie;(iv) in cazul omografiilbr; se genereazd pe rdnd qi se afigeazd toateparadigmele corespunzdtoare lemei qi clasei date.

Formatul de prezentare a paradigmei este dependent de clasa lexico-gramatical6 a cuvdntului flexionat. ln Anexa 2 prezentlm un exemplu curezultatele flexiondrii mai multor cuvinte.

2. 3. Concluzii privind procesul de flexionareModulul de flexionare este astfel conceput incdt sd poati fi incorporat cu

uqurinfi in divcrse aplicalii,

SILEX - FUNCTIILE DE LEMATIZARE $I DEGENERARE A PAMDIGMELOR 279

O primd utilizare real6 a lui a fost fficutl la verificarea corectitudinii datelordin diclionar qi din listele de terminafii, '

Se preconizeazi ca modulul sd fie incorporat in aplicafiile care folosescdiclionarul computerizat, pentru a ofpri utilizatorului un mijloc de verificare a

datelor introduse ulterior spre a imbogIli diclionarul furnizat. in plus, modululde flexionare poate fi incorporat in aplicafii de naturd didacticd, de invS[areasistatd de calculator a'tnorfologiei limbii romAne.

3. Consideratii finaleTratarea computerizatd a textelor romdneqti nu se poate realiza in absenla

unui instrument cum este SILEX. Modulele de lematizare ;i flexionare facposibild dezvoltarea diverselor aplicalii vizdnd prelucrarea automati a textelorromAneqti. Enumerim doar cdteva dintre aceste aplica{ii, in ordinea crescindia complexitE$i lor funclionale:

a. dicfionar ortografic qi morfologic computerizat al limbii romdne, ugor deintrelinut qi imbogifit, furnizabil atdt in formd computerizati, cdt gi in fcirmdtipdrit6;

b. corector ortografic gi morfologic pentru textele romineEti;c. slstem pentru snrciii tie statisticd iexicali qi gramaticaid asupra texteior

literare;d. sistem de realizare a concordanlelor penku operele literare romineqti, cu

lematizare in mare parte automatd;e. suport didactic penfu studierea asistati de calculator a gramaticii limbii

romdne in invdlimintul preuniversitar qi pentru invd(area limbii romine calimbd strdind (ortografi e, morfologie ;i lexic).

ANEXA 1

Exemplu de antalizd a unui text dat

AMURGTrec corbii * ah, ,,Corbii"Poetului Tradem -$i curg pe-nnoptatPe-un frig inghelat

Se duc pe pushi...

Pe cdnd, de argint,in amurg de argint,S-aprinde crai-nou,

280 SANDACHERATA. TEODORVU$CAN, EMMA TAMAIANU

Pe zdi argintiiin vastul cavou...Iubito ah,,,Corbii"Poetului Tradem...

Forma

amurgtreccorbiiahcorbiipoetuluiqi

qi

qi

curgpennoptatnnoptatpeununfrigfriginghelatinghe!atSC

ducpepustiipustiipecinddedeargintS

aprinde

Lema

* anurg* frece* corb*ah* corb* poet*qi*Ei* sine* curge*pe* innopta* innoptat*pe*un+ un_l* frige* frig* inghela* inghelat* sine* duce*pe* pustii* pustiu*pe* cdnd+de*de* argint* sine* aprinde

., Atribute

* sb * n,NiA sg.neart.* vb * Indicativ,I,sg.* sb + m,N/A pl. art.*in** sb * m,N/A pl. art.* sb * m,G/D sg. art.*av**cj** pn *refl,mf,Ill,sg.,D* vb * lndicativ,I,sg.*pp** vb * Participiu* sb * m,N/A sg.neart.*pp** ar * m,N/A sg.* aj * nehot,m,N/A sg.* vb * lndicativ,I,sg.* sb * n,N/A sg. neart.* vb * Participiu* aj * m,N/A sg. neart.* pn * refl,mf,Ill,sg.,A* vb + Indicativ,I,sg.*pp** vb * Infinitiv* aj * m,N/A,pl.,neart.*pp**av**cj**pp*'* sb * m,N/A sg. neart.* pn * refl,mf,Ill,sg.,A* vb * Indicativ,lll,sg.

srLEX - FUNCTTTI.E DE LEMATTZARE Sr DE GENERARE A PARADIGMELOR 2g1

cralnoupe

zdizdriargintiiinvastulcavouahcorbiipoetului

* crai* nou*pe* zdri* zare* argintiu*in* vast* cavou*ah* corb* poet

cascd niqtecdqti unorcdEti unorcascd ni;te

copil * substantiv masculin

* sb * m,N/A sg. neart.* aj * m,N/A sg. neart.*pp** vb * Infinitiv* sb * f,NiA sg. neart.* aj * m,N1A pl. neart.*pp** aj * m,N/A sg. art.* sb * n,N/A sg. neart.+in** sb * m,N/A pl. art.* sb * m,G/D sg. art.

casca cdgtilecigtii cd;tilorcigtii cdqtilorcasca clstile

ANEXA 2

Exemple de flexionare a unor leme date

cascl - substantiv feminin

NoD. uneiG. uneiA.o

NunD. unuiG. unuiA. un

N. unD. unuiG. unuiA. un

canton niEte

canton unorcanton unorcanton niste

castr

castlcdqti

cdEti

copil nigtecopil unorcopil unorcopil niqte

canton - substantiv neutru

copii copilulcopii copiluluicopii copiluluicopii copilul

cantoanecantoanecantoanecantoane

copiiicopiilorcopiilorcopiii

cantonul cantoanclecantonului cantoanelorcantonului cantoanelorcantonul cantoanele

282 SANDA CIiERATA,' TEODOR VU$CAN, EMMA TAMAIANU

auriu-- adjectiv

N. (un)

D. (unui)

G. (unui)I (un)

1v.(o)

D. (unei)

G. (unei)

A.(o)

N. (un)

D. \\Ltst I

G. (unui)l. (un)

A.(rt)D. (unei)

G. (unei)

A.(o)

auriu (niqte) aurii

auriu (unor) aurii

auriu (unor) auriiauriu (niqte) aurii

auriulauriuluiauriuluiauriul

auria auriileauriei auriilorauriei auriilorauria auriile

negrul

uvEr glul

negruluinegrul

Reagra

negrei

negrei

neagla

aunllauriilorauriilorauriii

negnlu!61rrvr

negrilornegrii

negrele

negrelor

negrelornegrele

(n$te)(unor)

(unor)

(niqte)

negru - adjectiv

negru (niEte)/,,- ^-\lrvBr u \qrvr ,,

negru (unor)

negnr (niqte)

neagrd (niEte) negre

negre (unor) negre

negre (unor) negre

neagrd (niqte) negre

aunlaunl

auriiaurii

negri

rrv6! r

negri

negri

aune

auriiaurii

aurie

turna - verb

Prezent

torntornitoarnd

hrmEm

turnalitoarnd

Perfecnl simplu

turnaiturnaEi

turndhrrnarlmturnar6li

turnari

Inperfect

turnamturnaitumatumamturnaliturnau

M.m.c.p.

turnasem

turnasegi

turnase

turnaserdm

turnaserdli

tumaserd

eu

tuelnoivoiei

SILEX - FUNCTIILE DE LEMATIZARE $l DE GENERARE A PAMDICMELOR 283

Conjunctiv Imperativ

eu sitomtu sb torni toai116

' '

el si toarnenoi sd tumdmvoi sd turnafi turnaliei sI toame

Infinitiv Infnitiv lung Participiu Gerunziu

a turna turnare tumat ilmand

merge - verb

Prezent PerJbctul simplu lmperJbct M.m.c.p.

eu merg mersei mergeam mersesem

tu mergi merseEi mergeai mersesegi

el merge merse mergea mersese

noi mergem merserdm mergeam merseserdm

voi mergeli merserdli mergeafi merseserdfi

ei merg merseri mergeau merseserd

Conjunctiv Imperativ

eu sd mergtu sd mergi mergiel sd mearglnoi sd mergemvoi s[ merge{i mergeliei sd meargd

Infnitiv Infinitiv lung Participiu Gerunziu

a merge mergere mers merg6nd

284 SANDACHERATA, TEODOR.VU$CAN, EMMATAVATNNU

eutuelnoivoiei

vedea - verb

Prezent

vdd

vezivedevedemvedelivdd

Conjunctiv

eu sivddtu si veziel sd vadlnoi sd vedemvoi sd vedeliei sd vadd

Perfectul simplu

YAZ.n

v5zuEi

vdzuvdzurdmvdznrrSfi

v-aznrd

Imperfect

vedeamvedeaivedeavedeamvedea{ivedeau

M.m.c.p.

v6zusemvdzuse;ivdzusevdzuserdmvizuserd[ivdzuserd

M.m.c.p.

qtiusernqtiuseEi

;tiuseEtiuserdmgtiuserd!i

;tiuserd

Imperativ

vedefi

Infinitivlung Participiu

vedere vdz.fi

vezl

Infinitiv

a vedea

gti - verb

Prezent Perfectul simplu

eu qtiu qtiuitu qtii Etiugiel qtie qtiunoi qtim Etiurdmvoi Etili ;tiur6{iei qtiu ;tiurd

Conjuncliv ImPerativ

eu sI Etiutu s6 qtii ;tiiel sd gtie

Gerunziu

v-az?nd

Imperfect

gtiam

Etiaigtiagtiamqtiali

Etiau

SILEX - f UNCllrl-r. DE LEMAT]ZARE $t DE CENERARE A PARADTCMELOR 295

noi sd Etimvoi sd qtifi $titiei s6;tie

Infinitiv Infiniliv lung Participiu Gerunziu

a Eti qtire qtiut Etiind

SURSE BIBLIOGRAFICE

[] DUMITRU IRIMIA, Structura gramaticald a limbii romane.Verhul,laqi, 1976.

[2] ION COTEANU, Grumuticu de hazd u limbii ronidne, Bucurqti, 1982.

t3l V. CUTU ROMALO, Morfologiu struc'turuld a limbii romdne (substantiv, udjectiv, verb),Bucureqti,1968.

t4l GR. MOISIL, Probleme de traducerc aulomatd. Conjugarea verbelor in ltmba romdnd, inSCL, XI, 1960, nr. 1,p.7-25.

[5] Gramatica limbii romdne, Bucureqti, Editura Academiei, 1966.

[0] Cn. MOISIL, Probl,imes posds per la truduction automatique. La declinaison en roumuin

icrit, in CLTA, II, 1962.

[7] M. MANOLIU, Morfemul in lingvistica modernd, in LR, XII, 1963, nr. L

18) Diclionar ortografic, ortoepic' ;i morfulogic al limbii romdne, Bucuregti, Editura Academiei,t982.

[9] V. BREBAN, Diclionar general ul limhii romdne, Bucurqti, 1992.

fl}l Diclionar ortografit cu elemente de ortoepie Si morfologie. Redaclia principal5 a

Enciclopediei Sovietice Moldoveneqti, Chiginiu, I 991 .

I l ] J. D. ULLMAN, Principles oJ'Database System.r, Computer Science Press, 1982.

tl2l COLING BUDAPEST. Proceedings of the I2' Intemational Conference on CompulationulLinguistic.r, 1988.

tl3l J. S. BIEN, Ioward Computerizied Diclionariesfor Inflexbnal Languages. Internal design

philo.rophy, in Machine Translation, Cambridge Univenity Press, 1987.

tl4l M. KAY,The Dictionary of the Future antl the Future of the Dictionary,in MuthineTranslation, Cambridge University Press, I 987.

[15] A. ZAMPOLLI, Lexicological awl Lexicographical Activities ut the Istitukt tli Linguistica,

in,,Linguistica Cornputazionale", I 983/3.

Univdrs itatea,, B a he s- B olya i "Facultutea de Lilere

Centrul de Analizd a TextuluiCluj-Napoca, st. Horeu, 3l