044_2004_v2_julia pajzs_wade through letter a_ the current state of the historical dictionary of

Upload: escarlata-ohara

Post on 07-Jul-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    1/8

    REPORTS

     

    ONLEXICOGRAPHICAL

     

    AND

     

    LEXICOLOGICAL PROJECTS

     

    Wading through

    LetterA:The

     Current

     

    State

     

    ofthe 

    Historical

     

    Dictionary of

     

    Hungarian 

    Júlia Pajzs 

    Research

     histitute

     fo r

     L inguistics 

    Hungarian 

    Academy

     of Sciences 

    H-1068 Budapest Benczur u. 

    33,

     Hungary 

    [email protected]

     

    Abstract 

    The Historical Dictionary

     

    ofHungarian project has

     

    been

     

    underway

     

    for

     

    some 

    years.

     The first

     stage

     consisted 

    of

     

    the collection and 

    analysis

     of

     

    a 25 mHlion 

    word

     Historical Corpus of 

    Hungarian.

     

    Work has no w begun on the 

    dictionary 

    itself. 

    It will contain 

    approximately 

    100,000 

    entries

     

    in

     eight volumes. 

    Each

     

    sense

     

    ofeach

     headword

     

    will 

    be 

    illustrated

     

    with 

    actual

     

    corpus examples, including

     

    bibliographic

     references to the

     sources.

     The 

    period 

    to 

    be covered 

    is

     772-2000. The present paper summarizes 

    lessons

     learnt while working on  the letter  A

    .

     

    Introduction 

    T he Historical Dictionary 

    of

     Hungarian roject

     

    as een

     

    nderway

     or ome ears. W e 

    collected

     

    an d

     

    analysed

     

    the

     

    Historical

     

    Corpus

     

    ofHungarian 

    (Pajzs

     

    991,

     

    997,

     

    2000,

     

    2002)

     

    over 

    a

     number

     

    of years, while 

    at the

     

    same

     time 

    experimenting with 

    ways 

    of compiling

     

    draft 

    entries. After

     

    extensive ebate bout

     

    what

     he 

    ictionary hould

     

    ontain, he

     umber of

     

    projected volumes, as well as the historical

     

    span

     to 

    be

     covered, w e compromised on an eight- 

    volume

     dictionary, with 

    some

     00,000 

    entries,

     covering the period

     between

     

    77 2

     an d 2000.

     

    T he 

    entries

     are based not only on the electronic corpus, but 

    also

     

    include

     old-fashioned, hand- 

    written ictionary lips 

    ro m

     

    arlier

     ttempts. 

    ac h

     ense 

    f

     ac h eadword  il l e 

    illustrated by corpus examples,

     

    including 

    bibliographic

     reference

     

    to the sources.

     

    T he design 

    restricts the maximum

     

    number

     

    of

     examples from

     

    the sources:

     

    only

     

    the earliest quotation

     

    fo r 

    each

     

    sense

     

    of

     the

     

    headword is

     

    to

     

    be included. T he 

    decision

     restricts the number

     of

     examples 

    per

     

    sense

     

    to

     

    one,

     

    which

     

    s

     

    normally

     

    the

     

    arliest

     

    quotation

     

    found.

     

    ince

     

    this

     

    trict

     

    rule

     

    has

     

    proved

     to o

     

    restrictive,

     I 

    suggested

     

    including

     

    some

     

    hidden quotations,

     

    to 

    be available 

    only 

    in the

     

    electronic version ofthe

     dictionary.

     

    T he

     manual or he 

    reparation

     of

     

    the 

    ictionary

     w as ublished ast 

    ea r

     Ittzés

     

    2002) ,

     an d in the same

     

    year 

    the

     

    actual

     

    writing

     

    of 

    the

     entries 

    finally 

    got

     

    underway.

     

    By

     mid-

     

    2003

     

    w e reached letter

     

    B, 

    which w as a

     

    historical moment in 

    the

     life 

    of

     this extremely long- 

    term

     project. In the present 

    paper

     I

     

    would

     

    like summarize our xperience

     

    in producing the

     

    entries 

    for 

    the

     etter

     

    A .

     

    his

     

    does

     

    not, 

    adly, mean 

    that

     every 

    single

     

    entry

     in

     

    A

     

    has 

    been 

    finalized:

     

    from 

    the 

    4800 

    headword

     lemmas

     

    selected fo r letter A

     

    v er 97% were finalized by 

    spring 2004. The

     

    analysis

     

    is 

    based

     on these

     

    entries.

     

    397 

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    2/8

    EURALEX2004  P R OC E E D I N G S 

    1.

     

    Selection

     

    oftbe 

    Headword

     

    Lemmas

     

    The election

     s 

    ased

     n 

    everal re)sources. irst,

     

    he

     major

     Hungarian

     

    monolingual 

    dictionaries 

    re

     onsulted. 

    Most

     of he 5,000 eadword emmas f

     

    he 

    ne

     

    olume 

    monolingual dictionary of

     Hungarian

     (Pusztai 003) 

    will

     be

     resent

     

    n ur

     dictionary

     s

     

    well. With

     the

     nclusion 

    f

      selection of words ro m he ineteenth entury

     

    historical 

    dictionary ofHungarian

     

    (Czuczor-Fogarasi

     

    1862) 

    some archaic

     

    or

     

    infrequent

     

    words 

    can 

    be 

    saved

     or 

    posterity.

     Certain

     words

     

    hosen 

    rom

     

    the ictionary of foreign

     words

     

    Bakos 

    2002),

     

    distinct 

    Hungarian

     

    genre, were uite requently sed 

    n

     

    the ineteenth entury, 

    others

     

    have

     

    recently

     

    revived

     

    due

     the 

    influence 

    of

     Europeanization

     

    and

     

    globalisation

     

    Naturally,

     w e are 

    adding

     

    many

     hitherto unregistered

     

    words, in so far as the

     

    estricted 

    scope 

    of

     

    the work makes this possible.

     

    A

     

    number

     

    of 

    interesting

     

    ancient

     

    and/or

     rare words

     

    have

     

    been

     

    foimd n

     

    the

     orpus eg. gyszék

     sofa',

     kaszték

     

    loop

     

    on

     

    lothing)',

     

    alamuszta

     iaisy, ciumsy').Neologisms,too,areincluded.

     

    2. The Structure of 

    th e

     Entries

     

    The

     

    structure

     of

     

    he entries 

    is

     

    compiled

      in 

    an

     XM L 

    DTD,  based

     on  the 

    TEI 

    recommendations.  TEI ags 

    re

     sed whenever 

    orresponding 

    tem w as ound 

    n

     he 

    recommendations,

     while for items 

    not

     present in 

    the

     standard 

    a

     

    short

     

    English-based

     tag set

     

    w as

     

    prepared.

     

    he

     

    DTD

     

    w as

     based 

    on

     

    our tyle heet, repared

     

    in

     

    cooperation

     

    with

     

    the 

    editors, •

    cases

     

    where

     the

     

    lemma is 

    classified

     

    as

     

    more

     

    than

     

    one

     

    part

     of 

    speech

     a

     

    block

     

    called

     

    'sensegroup' .

     

    istead ofpresenting 

    the

     whole DTD, here I 

    show

     

    only

     

    the

     

    skeleton 

    structure: 

    entry head, (sengr*|sense*)) 

    sengr

     

    (sense+)

     

    sense 

    (def, cit,

     (subsen*)) 

    The

     

    element

     

    referred

     

    to

     as  is 

    a

     

    subsense, 

    or a 

    shade

     

    of

     

    meaning, bi

     

    the

     

    printed 

    version

     

    these

     

    will

     

    be

     

    marked

     

    by letters

     ofthe

     

    alphabet

     

    (a, b, 

    c,

     etc.). 

    A

     

    sample

     

    entry is

     presented 

    in

     

    Figure

     

    1

    árnyalat

     

    fn 

    39 8

     

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    3/8

    R E P O R TS

      O N L E X I C O GR A P HI C A L

    A N D L E X l C O L O G l C A L

     PROJECTS

     

    1. 'vmely 

    zín

     öle nyhén ltérö

     

    változata':

     

    ||la. 'vmely zínnek ötétebb,

     

    ll . 

    ilágosabb

     

    fokozata':

     

    A

     

    hegy

     

    alján

     

    végig

     

    zúdul

     

    a

     

    [...] 

    mindig

     

    ezer zöld 

    árnyalatbanjátszó

     

    kristály

     

    tiszta

     

    Traun (1877 Wohl

     Janka, 

    W o b J 

    Stefania C4560, 74) 

    Az

     öltönyökben  ö

    a kék

     színt szereti,

     

    annak

     

    minden

     arnyalatat l880

     Jókai

     

    Mór C2301 , 

    46). 

    |

     lb.

     'vmely

     

    színnek

     

    eg y

     

    másikkal 

    kissé keveredö

     

    változata': Szineik

     

    [ti.

     

    halaké]

     minden

     

    árnyalatot

     felöleltek}

     

    (1947

     

    Szabó

     

    Lorinc2000629171,57)| 

    [Werner] haja

     

    hirtelenszöke és olyan

     

    bajusza

     

    s,} ém i ötes 

    árnyalattal 

    (1957

     

    Rónay

     Gyòrgy

     

    C3638, 5 ). 

    2 . (átv s) 'kis sekély

     

    elentéktelen ulönbséget

     

    ltérést 

    utató

     

    áltozat,

     

    fokozat':egy

     

    ö' 

    etszelgésének

     zer 

    ...] rnyalatai 

    vannak(1847Kemeny 

    ZsigmondC2599,49)|a uzgóság 

    özt

     s 

    an

     zer rwyo/irf(1852Kemeny

     

    Zsigmond 

    C 2 5 9 3 ,

    205)

      [Clermontné] 

    gy rnyalattal artózkodóbban 

    ogadta,

     

    in t 

    máskor

     (1895

     

    bonyi

     

    Arpád

     

    C0473,

     

    84)

     

    senki

     

    sem

     

    érti

     

    és

     

    érzi

     

    m eg

     

    a

     

    költöi

     nyelv

     

    minden

     

    árrtyalatának

     

    varázsát

     

    az 

    elsö

     

    hallásra 

    (1918

     

    Babits

     Mihály C0696, 2 2 2 )  a

     v ad

     világ

     

    többé 

    nem

     

    ly ivár:

     

    gy rnyalattal urhetobb(1928Toth 

    ArpadC4230,146)|Soltesz

     nni 

    anyós-figurája ...] gondoskodik komikum rösebb arnyalatairol 1964Magyar 

    Nemzet 

    márc.

     8. 

    C4801,

     10)

     ||

     2a. (kissé 

    rég)

     

    'politikai

     

    nézet, 

    irányvonal, 

    áramla

     

    :

     Voltak 

    árnyala tok

     

    yilvánitott

     

    ézetekben, e zon

     döben még sak

     

    rnyalatok,

     llentétek

     

    em(1860- 

    1862Kossuth ajos?,?)|{Oten itatkoznak } indegyiknek

     

    ás

     

    olitikai 

    arnya/ata(1889Justh sigmondC2463,14)|a

     

    üggetlenségi

     

    ár t ét 

    rnyalatra

     

    szakadt

     (1900

     

    Budapesti

     Napló

     szept.

     C0057, 6).

     

    3.fnr^'arnyek': 1843AthenaeumC0027,360)|az le t ly 

    ok

     

    rnyalat ta l

     bir,  sak

     

    egyetlen

     

    fénye

     

    van,

     

    és

     

    ez

     

    a

     

    szeretet(1872

     

    Bajza

     L,

     

    1).

     

    Vö.

     

    zF.; ErtSz.;

     TESz.

     

    árnyék;

     EKsz.

     

    Szócikkíró: KéthelyAnna; elsö 

    változat

     kelte: 2003.

     

    07 

    Szerkesztö: Ittzés 

    Nóra;

     

    szerkesztés

     kelte: 

    Cédulák száma: 

    Korpuszbeli

     adatok száma:

     

    591. 

    A szócikk 

    állapota: 

    Figure

     

    1 : T he entry árnya la t 'nuance' 

    T he quotations

     

    in braces } re the so called hidden examples ,

     

    only 

    to be included in the 

    electronic version ofthe

     dictionary.

     

    Sometimes 

    only

     parts ofthe

     

    quotations ar e

     

    hidden. 

    T he

     

    result

     

    ofthe

     

    statistical

     

    analysis

     

    ofthe

     

    completed

     

    entries

     

    is

     

    given

     

    in

     

    Table

     

    2 .

     

    399

     

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    4/8

    E U R ALE X2 0 0 4  

    P R O C E E DIN G S 

    A

     

    Subsense

     

     

    No

     

    subsenses  A  over

     

    • 

    T o t a l

     

    sense  9 9 7 

    9 1 4

     

    1 9  1911 

    52

    2   senses 6 2 7  3 5

    1 7 9

     

    9 7 7

     

    27

    3  

    senses

     3 2 3  1 9 

    2,96

     

    4 3 2

     

    12

    4

     

    senses

     

    1 6 3 

    2 4 

    6,79  1 8 7  5

    >4

     

    senses

     

    1 6 4  1 5  10,93 

    1 7 9 

    5

    3686 

    10 0 

    Table

     2 : Statistical

     

    analysis

     

    ofthe

     completed 

    entries 

    omparison

     with 

    he

     tructure of argest 

    monolingual

     

    ictionary

     of Hungarian 

    (Barczi t l 

    959-1962)

     

    hows

     

    that

     

    the major features re uite 

    imilar:

     

    v er

     

    half of

     

    the 

    words have 

    only

     one 

    meaning,

     

    either with

     or

     

    without 

    a

     

    submeaning,

     

    a

     

    quarter

     of the words 

    have two meanings, while the 

    number of

     words having four

     or more meanings

     is around

     

    10 

    per

     

    cent. 

    3.

     The 

    Illustrative

     Quotations  

    T he

     citations are

     chosen

     from

     

    wide 

    variety

     

    of

     

    (re)sources: the

     

    25-million-word

     Historical 

    Corpus 

    of

     Hungarian,

     

    ome

     

    6 million

     

    traditional dictionary 

    slips, 

    an d a

     

    collection of prose 

    fiction

     

    published

     

    on

     

    CD-Rom, 

    Non-finalised entries 

    acDs 

    Slips 

    D

     Dictionaries 

    D  Missing codes

     

    Historical

     

    Corp

    us 

    Figure 

    2 : he 

    use of

     

    different

     

    resources 

    newspaper

     

    materials

     

    nd he

     

    major monolingual ictionaries. he ctual se

     f hese

     

    resources is illustrated in Figure 2 . W e 

    may

     note 

    that

     

    the

     use of the C D 

    resources

     is more 

    frequent in

     

    the non-finalised

     

    (i.e.

     the

     

    prepared,

     

    but

     

    as

     

    yet

     

    unedited

     

    an d

     

    uncorrected) 

    entries

     

    than

     in 

    the final

     versions.

     This

     

    may

     

    b e

     

    due

     partly to 

    the

     

    fact that the

     unedited 

    entries

     

    contain 

    4

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    5/8

    REPORTS

     

    O N  

    LEXICOGRAPHICAL A N D

      LE X IC O LO G IC A L

     

    PROJECTS  

    a far

     

    higher

     

    number

     of

     

    ess

     

    carefully

     

    chosen

     

    quotations than 

    the

     final

     

    versions, 

    because 

    the

     

    majority

     of

     

    the

     

    lexicographers

     

    in

     

    our

     

    team

     

    are

     

    new

     

    or

     

    fairly

     

    new

     

    to

     

    the

     field 

    and

     

    thus

     

    not

     yet 

    fully

     

    confident

     

    in their choice

     

    of

     the most 

    suitable

     

    illustrative

     

    quotation. 

    Another

     reason 

    is

     

    that

     

    our C D resources

     are

     continuously

     

    expanding

     

    an d

     

    thus

     

    the

     number of

     

    quotations 

    from

    these

     

    is growing

     

    as w e

     proceed

     

    with

     the work . 

    Although 

    he umber of

     illustrative

     uotations

     s airly estricted, y

     

    using

     

    he hidden

    examples 

    t

     s

     

    possible

     

    to 

    isplay 

    the

     

    uses of

     

    the

     

    given

     

    meaning 

    during the

     whole

     period

     

    covered

     by

     the 

    dictionary.

     Figure 

    shows

     

    the distribution ofthe 

    quotations 

    by 

    date.

     

    Non-finalised entries 

    Dates

     

    Figure 3: 

    T he

     distribution of

     he

     quotations 

    by

     date 

    A s

     

    w e

     

    re

     

    oncentrating

     

    n

     

    he

     

    arliest

     

    uotations

     

    or

     

    ac h

     

    ense,

     

    he

     

    graph

     

    has

     

    ocal

     

    maximum

     

    at

     

    the

     starting 

    point

     

    of the

     

    time 

    interval,

     

    nd

     the bsolute minimum at

     

    the

     next 

    quarter-century,

     

    where

     

    the

     

    number

     ofhidden

     

    examples is 

    also

     

    limited.

     

    A

     

    local

     

    maximum

     

    can 

    b e 

    een

     

    he

     ast 

    uarter

     

    of 

    the 

    9

    th

     

    entury 

    ue

     

    w o

     

    easons.

     On he

     ne

     

    and,

     he

     

    lexicographers

     try

     

    to 

    llustrate he

     

    senses as 

    used

     in

     the

     late 9

    th

     

    century,

     

    and 

    on

     the

     other 

    hand,

     

    the most

     

    frequently used

     C D 

    resources (a standard

     

    multi-volume 9

    th

     encyclopaedia,

     

    the

     Pallas,

     nd he

     

    omplete

     

    orks

     

    f w o

     

    ell-known

     Hungarian

     

    uthors, 

    ókai

     

    nd 

    Mikszáth)

     

    were

     

    also 

    produced

     

    in 

    that

     period.

     

    he 

    surprisingly

     

    arge

     

    maximum

     

    in 

    the

     

    final

     

    quarter of

     the

     

    whole

     

    period is

     

    the result

     

    of similar

     

    factors:

     

    the most 

    frequently

     

    used

     

    resource 

    is 

    C D

     

    ontaining

      aily

     ewspaper 

    ro m

     he eriod

     

    994-1998

     Magyar Hirlap). 

    comparison

     

    ofthe

     

    tw o

     

    graphs

     

    reveals

     

    that

     

    the

     

    graph

     

    ofthe

     

    final

     

    version

     

    entries

     

    has

     

    a

     

    slightly

     

    narrower

     

    range

     than that 

    ofthe

     non-finalised

     

    entries.

     

    Figure . resents

     

    the

     

    graph

     

    of

     

    the

     

    earliest

     

    quotations, howing 

    similarity 

    to

     

    the

     

    ormer

     

    graphs

     p o he nd 

    of

     the

     

    9th entury. or ater eriods 

    here

     s 

    nice

     

    nd

     

    mooth 

    convergence.

     

    401

     

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    6/8

    EURALEX2004  P R O C E E D I N GS  

    Earliest

     

    quotations

     

    • 

    1000

     i 

    E

     

    50 0

     

    * ~ *—

     

    »

     

    • 

    V  

    • 

    •• 

    •• 

    •• 

     

    Dates

     

    Figure

     

    4: 

    T he graph 

    ofthe

     

    earliest

     

    quotations 

    hi 

    spite of 

    inequalities

     

    in the

     representation of certain 

    authors

     an d 

    sources,

     on

     

    the

     whole the

     

    use

     

    ofthe

     

    various 

    sources 

    is

     

    fairly

     balanced:

     

    the 

    examined

     25,000 

    sentences

     were taken 

    from 

    over 4,000

     different extracts from 

    over

     

    2,000

     different 

    authors

     

    (the

     

    25-million-word

     

    corpus

     

    is

     

    derived

     

    from

     

    about

     

    2,500 authors). Continuous

     

    monitoring is

     

    helping

     

    us

     

    identify

     

    errors 

    to

     

    b e

     avoided 

    in

     the future.

     

    Naturally, in the 

    dictionary

     database

     an y

     word 

    in 

    the 

    illustrative

     sentences can

     b e

     searched 

    for. 

    Contrary

     

    to

     the tradition of

     most

     English monolingual 

    dictionaries,

     our lexicographers 

    do ot specially 

    ry

     o void 

    entences

     ontaining well-known proper names. t s 

    oth

     

    exciting an d 

    instructive 

    to 

    search for 

    some ofHungary's

     best-known 

    figures, as

     

    this 

    forces

     

    us

     

    to

     

    consider

     

    our

     

    chosen

     

    example

     

    from

     

    a

     

    different

     

    angle.

     

    For

     

    example,

     

    we

     

    had

     

    to

     

    confront

     

    a

     

    rather ambiguous 

    mage

     n the ase of one 

    of

     Hungary's

     

    greatest 

    poets Endre Ady 

    (1877-

     

    1919), who 

    w as

     notorious 

    or

     his provocative 

    behaviour.

     t may well e dvisable not o 

    over-represent

     

    these

     events of

     

    his ife 

    n

     

    the

     argest monolingual dictionary of

     

    Hungarian, 

    which

     

    will

     provide 

    very important perspective 

    on 

    Hungarian 

    culture

     

    as

     a

     

    whole.

     

    It 

    is

     also 

    revealing

     

    to search fo r

     

    the 

    names

     an d

     events

     of

     

    the

     times

     

    before 

    the fall of

     

    communism 

    in

     

    Hungary

     

    n

     989. For xample, he am e of 

    Hungary's

     uler, 

    ános

     Kádár, 

    w ho

     

    w as

     n 

    power fo r

     

    more than 30 years

     

    (1956-1988),

     

    occurs

     

    in the

     illustrative 

    sentences

     more 

    than 2 0

     

    times,

     

    mainly

     

    n unfavourable

     

    ontexts,

     nd

     

    t often 

    collocates

     

    with

     the 

    words

     pa, 

    ty a

     

    father , illustrating that 

    he

     

    was

     considered a father 

    figure,

     rather

     

    than a b ig brother . 

    O ne

     

    of

     

    my

     

    favourite

     

    quotations

     

    used

     

    as

     

    a

     

    partially

     

    hidden

     

    illustrative

     

    example

     

    in

     

    the

     

    entry

     

    apa 

    is

     

    the

     following:

     

    Amikor

     kissrác

     

    vol tam, 

    azt mondták

     körülöt tem. Horthy 

    apánk.

     Az

     

    idösebbek m ég

     

    úgy 

    mondták ,

     

    erenc Jóska apánk. Aztán

     

    jótt 

    Rákosi

     

    apánk.

     Ment

     s. Aztán jott 

    Kádár,

     s 

    amikor már falun 

    azt

     

    hallottam,

     ogy Kádár

     

    apánk, 

    kkor 

    n m e n t e m  

    Konrád 

    G y ó r gy :

     Agenda. Kerti 

    mulatság,

     1989.)  

    'When

     I 

    was

     

    a

     

    lad,

     I heard 

    about

     

    our

     father

     Horthy

     

    [governor ofHungary between 

    the 

    wo

     

    World 

    Wars] .  he

     

    lderly

     

    till

     aid:

     

    our

     

    ather 

    Franz

     oseph Habsburg 

    emperor

     

    nd 

    ing

     

    Hungary

     efore 

    W W I ] .

     Then

     am e ur ather ákosi 

    [communist 

    party

     eader n the 

    950s].

     Then 

    he

     went. Then am e Kádár, nd 

    as

     

    soon

     

    as

     

    I heard

     

    in

     

    the

     

    countryside:

     

    our father Kádár,

     

    it

     was 

    me

     who

     

    left'.

     

    T he 

    author

     of this quotation is 

    the

     dissident writer György Konrád, silenced 

    fo r

     more than 

    fifteen years 

    because

     

    ofhis

     political views.

     

    4 2 

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    7/8

    REPORTS

     

    ONLEXICOGRAPHICAL

     A N D LEXICOLOGICAL

     

    P R O JE C TS 

    Future

     Plans

     

    T he first volume 

    of

     th e dictionary,

     

    containing

     letter A-B,

     

    is

     

    due

     

    to

     

    appear in 2005 or 

    2006.

     

    T he

     lectronic ersion 

    of

     

    the

     

    ictionary

     

    will

     e 

    ublished

     

    longside

     he

     

    printed

     

    ersion, 

    containing

     he 

    dditional

     idden 

    xamples

     nd he 

    atabase

     f the bibliography f the

     

    (re)sources. 

    W e

     re lso 

    onsidering

     he 

    nclusion

     of some dditional nformation n he

     

    database

     version. O ne 

    idea

     is to 

    ad d

     some

     

    specification

     

    of

     th e

     

    domain of the

     

    sense, o 

    that 

    one can search for al l 

    the

     words which 

    refer

     to colours, 

    or

     names 

    offlowers, or

     

    vehicles,

     

    etc.

     

    T he

     hierarchic 

    specification

     still 

    has

     

    to be worked

     out,

     

    nd

     the 

    easibility of

     this

     proposal

     

    must

     

    be 

    ested 

    on 

    sample

     of

     

    entries.

     

    O ur

     

    international dvisor

     

    Anna

     

    Braasch uggested 

    using

     the SMPLE ontology 

    fo r

     

    this

     task. The application of the 

    framenet

     approach 

    is

     also

     

    being

     

    onsidered.

     

    nother

     

    very

     

    nteresting

     

    dea

     

    w as

     

    roposed

     

    by

     

    our other nternational

     

    advisor Peter

     

    Sherwood,

     

    to include the 

    English

     equivalent of the meanings

     

    in

     

    the

     

    database

     

    version.

     

    his

      ould ertainly nlarge he 

    umber

     f

     

    he ossible sers 

    f

     he uture 

    dictionary,

     

    b ut

     

    it would 

    necessitate

     a 

    corresponding

     

    bilingual

     

    dictionary

     

    project.  ince

     

    our 

    major 

    roblem s he

     ack 

    of

     

    adequate

     

    inancial

     

    nd 

    uman

     

    esources,

     

    hese 

    deas

     might

     

    remain

     in the reahn ofdreams.

     

    Conclusion 

    hi 

    spite

     of

     

    being 

    a

     

    computational

     

    lexicographer,

     

    during

     

    the

     

    long

     years 

    of 

    corpus 

    collection, 

    correction

     an d analysis, 

    often

     felt

     

    that

     it 

    would

     

    have been more

     

    ensible to ompile the 

    dictionary

     

    n

     

    he

     

    more

     

    raditional,

     

    ried

     

    nd

     

    ested,

     

    way,

     

    amely

     

    by

     

    using

     

    nly

     

    he

     

    ld

     

    archive 

    dictionary

     slips 

    an d 

    the good old paper-pencil-eraser

     method

     (especially after some

     

    major virus 

    nfections

     and 

    other

     

    dramatic

     

    computer

     

    disasters).

     However, s 

    w e

     urvey the

     

    ahnost-

     

    finalised database

     or

     the letter

     

    A , 

    it

     

    is

     tremendous to 

    be

     

    able

     to 

    check

     

    an d

     

    search

     the 

    aheady prepared 

    entries.

     

    It

     is definitely worth th e effort, after 

    all.

     

    Acknowledgements

     

    T he

     

    roject

     s 

    inanced

     y he 

    ollowing

     rants:  T KA  042705 , 

    NKFP

     /142, OKTK

     

    2004. , T KI2003-2006, 

    and mainly by the Hungarian Academy of

     Sciences. 

    References

     

    Bakos

     

    20 0 2 )

     

    degen

     

    zavak

     

    s

     

    i fejezések

     

    zótára

     

    Dictionary

     

    f

     Foreign

     

    Words'

     

    Akadémiai

     

    Kiadó,

     Budapest.

     

    Bárczi G Országh

     

    L (chief eds.) 

    1959-1962)

     

    A

     

    m a g ya r nyelv értelmezö 

    szótára

     I.-VII. 

    'The

     

    explanatory 

    dictionary

     

    ofHungarian'

     

    Budapest,

     

    Akadémiai

     Kiadó

     

    Czuczor

     G

    Fogarasi 

    J

     (1862)

     A m a g ya r 

    nyelv

     szótára 

    I.-VI. The

     dictionary

     

    ofHungarian'

     

    Pest, 

    Emich

     

    Gusztáv

    Magyar

     

    Akadémiai

     

    Nyomdász

     

    Ittzés

     

    N

     

    20 0 2 ) Az Akadémiai agyszótár zerkesztési

     

    zabályzata

     

    Style 

    heet

     or he 

    Academie

     

    Dictionary 

    of

     Hunganan'

     

    Muta

     

    ványok 

    az

     Akademiai

     

    Nagyszótárból.

     

    M T A 

    Nyelvtudományi hitezet, Budapest, 12-98. 

    Pajzs J (1991) The Use of 

    a

     LemmatizedCorpus fo r Compiling the Dictionary ofHungarian 

    Using

     Corpora Proceedings

     

    ofthe 7 ' n n u a l

     Conference

     

    ofthe OUP  Centrefor

     

    the 

    Ne\v

     O E D

     

    a n d

     Text

     

    Research.

     

    Waterloo,

     

    University

     

    ofWaterloo,

     

    p.

     

    29-136.

     

    Pajzs

     

    1997) ynthesis

     

    of

     

    results

     

    bout

     

    nalysis

     

    of

     

    corpora

     

    n

     

    Hungarian.

     inguistica>  

    Invest igat iones 

    XXÏÏ2 :

     349-365 

    4 3

     

  • 8/18/2019 044_2004_V2_Julia PAJZS_Wade Through Letter A_ the Current State of the Historical Dictionary Of

    8/8

    EURALEX2004 PROCEEDINGS 

    Pajzs J 

    2000)

     Making Historical 

    Dictionaries

     by Computer. Proceedings f UR L X 

    2

    UMch

     

    Heid

     

    ed.

     

    University

     

    ofStuttgart

    Stuttgart

    2000.p.

     

    249-259.

     

    Pajzs

     J (2002)

     

    Corpus

     

    Based Livestigation

     

    of

     

    Collocations 

    in

     Hungarian Proceedings

     

    of 

    E UR AL E X2002

     

    Center

     fo r

     

    Sprogteknologi, 

    Copenhagen,

     2002. p.

     

    831-840.

     

    Pusztai

    F.

     & 

    al.

     

    (2003).

     

    Magyar

     

    érte lmezö

     

    kéziszótár

     

    'Concise

     Dictionary ofHungarian.'

     

    Akadémiai

     Kiadó, Budapest 

    4 4