informatica umanistica d: lessicografia e computer dizionari: contenuti e storia

45
INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

Upload: riccarda-casali

Post on 01-May-2015

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER

Dizionari: contenuti e storia

Page 2: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

COS’E’ UN DIZIONARIO

Differenza tra dizionario, enciclopedia e libro di grammatica

Esistono molti tipi di dizionari diversi con obiettivi diversi

Page 3: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

TIPI DI DIZIONARI

Dizionari `general purpose’ = `desk’ o ‘concise’ Dizionari ‘di riferimento’ Dizionari per learners

Dizionari specialistici Dizionari bilingui Sinonimi & contrari / Tesauri (Roget)

Page 4: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

COSA SI TROVA IN UN DIZIONARIO ‘GENERICO’

Struttura del volume Struttura delle entries

Page 5: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

ORGANIZZAZIONE DI UN DIZIONARIO

FRONT MATTER + BODY + APPENDICES

FRONT MATTER: BODY: Alfabetico per LEMMI

(Ma: dizionario cinese)

Page 6: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SCELTA DEI LEMMI

Tre fonti primarie: Dizionari precedenti (non si parte da

zero) Citation file (= archivio di citazioni della

casa editrice) Sempre piu’ CORPORA

Page 7: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

I LEMMI IN DUE DIZIONARI

CED4 NODE

gl. GLA

glabella glabella

glabrescent glabrous

glabrous glacé

glacé glacé icing

glacial glacial

Page 8: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

COSA SI TROVA IN UN DIZIONARIO (Hudson, 1988)

La FORMA di un lemma (ortografia e pronuncia)

La sua STRUTTURA (Di quali morfemi e’ composto)

Il suo SIGNIFICATO (compresi sinonimi) Informazioni GRAMMATICALI Esempi di USO ETIMOLOGIA

Page 9: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

UN ESEMPIO

toad /təųd/ n. 1 any froglike amphibian of the family Bufonidae, esp. of the genus Bufo, breeding in water but living chiefly on land. 2 any of various similar tailless amphibians. 3 a repulsive or detestable person. toadish adj. [Old English tadige, tadde, tada, of unknown origin] (COD 9)

Page 10: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

FORMA DI UN LEMMA

PRONUNCIA Fonemi Prosodia (accento)

ORTOGRAFIA Sillabe Varianti

Page 11: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SIGNIFICATO

Una delle funzioni piu’ importanti di un dizionario e’ caratterizzare le ACCEZIONI di una parola attraverso DEFINIZIONI

Probabilmente l’aspetto piu’ difficile della lessicografia

Problema : come possiamo caratterizzare questo significato? Come minimo, occorre trovare un modo per

caratterizzare questo significato che ci permetta di distinguere tra significati diversi

Page 12: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DIZIONARIO ED ENCICLOPEDIA

TOADThe true toads are amphibians in the Bufonidae family. A number of species in other families of Amphibia are commonly referred to as toads. This is because the characteristics that are popularly used to distinguish frogs from toads are not quite the same as those used for scientific classification.The type species of the family Bufonidae is the Common toad, Bufo bufo, and around it cluster a large number of species of the same genus, and some smaller genera. B. bufo is a tailless amphibian of stout build, with a warty skin, and any animal that shares these characteristics is liable to be called a toad, regardless of its location in formal taxonomy.That the shape of the body is not a safe guide in judging of anuran groups is shown by some true frogs (Rana), which have adapted to burrowing habits, and are absolutely toad-like. The Bufonidae include terrestrial, burrowing, thoroughly aquatic and arboreal types; Rhinophrynus, of Mexico, may be described as an anteater.Almost all toads have two lumps near the head, called the parotid glands. These glands contain poison, which oozes out if the toad is angered. Some, like cane toads, are more poisonous than others.

Page 13: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

POLISEMIA ED OMONIMIA

La maggior parte delle parole hanno piu’ di un significato

Due tipi di distinzioni: POLISEMIA ed OMONIMIA POLISEMIA: ‘VERDE’ come ‘avente un certo

colore’ e come ‘ricco di vegetazione’ Tipicamente risulta da estensioni / riduzioni

OMONIMIA: ‘SCANNARE’ come ‘fare a pezzi’ / ‘italianizzazione di TO

SCAN’; GRU come uccello / macchina per sollevare pesi Tipicamente indica etimologie diverse

Page 14: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

PROBLEMI DI DEFINIZIONE

Evitare circolarita’ Putnam:

`faggio’ / `olmo’ `diamante’ / `zircone’

Jackson: happen vs occur vs befall vs transpire Everything is illuminated: `harmonize’ vs

`agree’,

Page 15: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SIGNIFICATO IN UN DIZIONARIO

RIFERIMENTO OK: ‘bicicletta’ / `tromba’ Piu’ difficile: ‘deferenza’ / ‘ridicolo’

CONNOTAZIONE: inspire vs. fundamentalist

RELAZIONI SEMANTICHE Synonymy Antonymy Hyponymy

COLLOCAZIONE

Page 16: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

RELAZIONI SEMANTICHE

SINONIMIA: quando due lemmi distinti hanno lo stesso significato Spesso essenziale per definizioni / traduzioni

(ETERONIMIA) ANTONIMIA: quando due lemmi hanno

significati CONTRARI Bello / brutto, amore / odio

IPERONIMIA: Garofano, rosa, margherita sono tutti iponimi di

FIORE MERONIMIA

Page 17: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SINONIMIA

Origini: Words from different strata:

Begin vs commence (Jackson p. 17) Dialect difference

Biscuit / cookie; Lorry / truck

Non e’ mai perfetta: Italiano: PAPA’ vs. PADRE / PEDALINO vs. CALZINO Everything is illuminated:

`harmonize’ invece di ‘agree’ ‘rigid’ invece di ‘hard’ ‘disseminate’ invece di ‘spend’ “forgetful dogs.”

Page 18: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

COLLOCAZIONI

Il verbo ban tipicamente modificato dagli aggettivi total o complete, associato con il verbo impose, etc.

Page 19: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

ESEMPI DI DEFINIZIONI

contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico

(Zingarelli 1995)

maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra

(Palazzi-Folena, 1992)

Page 20: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

INFORMAZIONI GRAMMATICALI

Morfologia Verbi: inflessioni Nomi: forma del plurale

Hoof hooves City cities

Sintassi Parte del discorso (con restrizioni: awake

predicative (the baby is awake) ma non attributive (*the awake baby)

Verbi: transitivo / intransitivo, quali tipi di preposizioni, etc.

Page 21: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DESCRIZIONE DELL’USO

Spesso in forma di citazioni (vedi esempi successivi)

Page 22: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

STORIA DEI DIZIONARI INGLESI, 1: GLOSSARI

Primi `dizionari’: i GLOSSARI medievali raccolte di GLOSSE in Old English di

parole latine, tipicamente scritte da monaci

Primi dizionari sono bilingui! Uno dei piu’ noti: The London

Vocabulary di Ǽlfric (XI secolo)

Page 23: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

STORIA DEI DIZIONARI INGLESI, 2: `HARD WORDS’

Rinascimento: cominciano i ‘prestiti’ da altre lingue (non solo Latino, ma anche Francese, Greco, Italiano)

Nasce la necessita’ di aver spiegazioni su `hard words’: neologismi introdotti di recente, con cui un ‘uneducated reader’ puo’ non avere familiarita’

Primo esempio di risorsa di questo tipo: Robert Cawdrey, A Table Alphabeticall, 1604 2500 parole

Page 24: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DA `A TABLE ALPHABETICALL’ DI CAWDREY

§ Abandon, cast away, or yeelde up, to leave, or forsakeAbash, blushabba, father § abbesse, abbatesse, Mistris of a Nunnerie, comforters of others § abbettors, counsellors….Apocrypha (g), not of authoritie, a thing hidden, whose originall is not knowne

Page 25: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

STORIA DEI DIZIONARI INGLESI, 3: DA CAWDREY A SWIFT

John Bullokar, AN ENGLISH EXPOSITOR (1616) Cockeram’s THE ENGLISH DICTIONARIE (1623)

Primo ad essere chiamato ‘DICTIONARY’ Anche `vulgar words’

Prime etimologie: Thomas Blount (1656), Stephen Skinner (1671)

A NEW ENGLISH DICTIONARY, di `J.K.’ (1702) primo tentativo di produrre un dizionario completo (28 000

lemmi) Per artigiani e mercanti

Nathaniel Bailey, AN UNIVERSAL ETYMOLOGICAL ENGLISH DICTIONARY sia completezza (40000 parole prima edizione, poi

50000) che etimologia

Page 26: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

CORREGGERE E `BLOCCARE’ (‘ASCERTAINING’) LA LINGUA

XVII secolo: molta preoccupazione che un numero eccessivo di parole straniere venisse assorbito nell’Inglese

Si guardo’ con favore al modello dell’ Académie Francaise, fondata nel 1635, e che produsse tra il 1639 ed il 1694 il DICTIONNAIRE DE L’ACADEMIE FRANCAISE con l’intenzione di ‘codificare’ e `ripulire’ il linguaggio

Jonathan Swift: A PROPOSAL FOR CORRECTING, IMPROVING AND ASCERTAINING (= FIX) THE ENGLISH LANGUAGE (1712)

Page 27: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SAMUEL JOHNSON (1709-1784)

When we see men grow old and die at a certain time one after another, from century to century, we laugh at the elixir that promises to prolong life to a thousand years; and with equal justice may the lexicographer be derided, who being able to produce no example of a nation that has preserved their words and phrases from mutability; shall imagine that his dictionary can embalm the language, and secure it from corruption and decay … (Preface al Dictionary of the English Language, 1755)

Page 28: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

THE DICTIONARY OF THE ENGLISH LANGUAGE

Prodotto tra il 1746 ed il 1755 con 6 assistenti

42773 lemmi Primo dizionario sviluppato secondo

metodi lessicografici moderni; la creazione del dizionario sollevo’ problemi ancora attuali per la lessicografia

Page 29: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SAMUEL JOHNSON: PLAN FOR A DICTIONARY OF THE ENGLISH LANGUAGE (1747)

Il lavoro comincio’ con lo sviluppo di principi da seguire Criteri di SELEZIONE ORTOGRAFIA e PRONUNCIA ETIMOLOGIA ANALOGY (inflessione) e SYNTAX INTERPRETATION (= definizione) CITAZIONI con AUTORE

Page 30: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

METODOLOGIA

Punto di partenza: dizionario di Bailey Identificazione di nuovi lemmi: lettura di

autori ammirati da Johnson Ogni volta che trovava un uso ‘corretto’,

sottolineava e marcava la citazione; un assistente avrebbe creato uno SLIP

Gli slip con citazioni (114000 in tutto) poi ordinati in modo alfabetico

A partire dal 1749, Johnson comincio’ ad identificare i sensi e scrivere le definizioni

Primo volume 1753

Page 31: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

RISULTATO

Page 32: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DEFINIZIONI FAMOSE

"Lexicographer: a writer of dictionaries, a

harmless drudge, that busies himself in tracing the original, and detailing the signification of words. “

"Oats: a grain which in England is generally given to horses, but in Scotland supports the people"

Page 33: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

THE NEW ENGLISH DICTIONARY

L’Oxford English Dictionary e’ quanto di piu’ vicino ci sia ad un ‘record ufficiale’ dell’Inglese (Britannico)

Obiettivo: creare un dizionario le cui definizioni fossero basate sui criteri ‘scientifici’ sviluppati nella nuova scienza della filologia Sotto gli auspici della Philological Society

Prima edizione richiese 70 anni (tra il 1858 ed il 1928) e 5 ‘editors’ Editor chiave: JAMES MURRAY

Page 34: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

THE NEW ENGLISH DICTIONARY: METODO

Principio: “to furnish an adequate account of the meaning, origin, and history of English words now in general use, or known to have been in general use at any time during the last seven hundred years” (dalla prefazione di Murray al volume I, 1888)

Basato sul lavoro di MIGLIAIA di volontari (READERS) che produssero 5 millioni di slips Tra cui D. W. C. Minor, paziente schizofrenico

Page 35: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

THE NEW ENGLISH DICTIONARY: LA PRIMA EDIZIONE

10 volumi 252 000 lemmi, 414 000 definizioni

Page 36: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

TRE TIPI DI PAROLE

Main words Subordinate words

Afforse, obs. variant of AFFORCE Afforst, obs. variant of ATHIRST

Composite

Page 37: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

STRUTTURA DELLE ENTRIES

IDENTIFICATION Spelling (con alternanze): Jowl, jole `Citizenship in the language’: Kursaal Pronunciation (non ancora IPA)

MORPHOLOGY Form history of the word

SIGNIFICATION ILLUSTRATIVE QUOTATIONS

Page 38: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

ESEMPIO (http://www.oed.com/cgi/display/wotd)

mowdie, n.

Sc., Irish English, and Eng. regional (north.).

Brit. / maudi/, / meudi/, U.S. / maudi/, / moudi/, Sc. / maudi/ 

Forms: Eng. regional (north.) 18- moudie, mowdie, (Northumberland) moody; Sc. pre-17, 18- (east.) moodie, 17, 19- (east.) moody, pre-17 17- moudie, 17- moudy, mowdy, 18 mouldy, 18- mowdie, 19- mouldie, mowdi; Irish English (north.) 19- moudie, moudy, mowdy. [Shortened < mowdiewarp, variant of MOULDWARP n.] 

Page 39: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SIGNIFICATIONI. Simple uses.    1. The Eurasian mole, Talpa europaea. Freq. attrib.  Recorded earliest in compounds (sense 3). 1656 Session Bk. Hutton Parish in Hist. Berwickshire Naturalists' Club (1873) 7 231 She did sie a moudie hillock in her lint. 1789 D. DAVIDSON Thoughts Seasons 62 List'ning to the chirp O' wand'ring mouse, or moudy's carkin hoke. 1810 R. H. CROMEK Remains Nithsdale & Galloway Song 105 Bessie's sleek as ony mowdie. 1868 J. HAMILTON Poems & Ballads 302, I..thocht this maun hae been the wark O' Robin's moudie huntin' tyke. a1869 C. SPENCE From Braes of Carse (1898) 186 There field mice and moudies litter. 1885 F. GORDON Pyotshaw 50 It's the cataract that mak's me as blin 's a mowdie! 1895 P. H. HUNTER James Inwick 130 No' like her enemies wha' worked below-grund like moudies. a1908 in M. Traynor Eng. Dial. Donegal (1953) 191/1 A countryman told me he got 4/6 a lot for common Irish clay in Scotland to keep off the mowdies. 1996 C. I. MACAFEE Conc. Ulster Dict. 229/2 Mowdy, moudy, moudie, the mole.    2. A mole-catcher.  Sc. National Dict. (1965) s.v. mowdiewort, records this sense as still in use in central and southern Scotland in 1963. 1828 W. CARR Dial. Craven (ed. 2), Moudy, a mole catcher. 1882 A. L. ORR Laigh Flichts 37 The moudie clutched the candle up, Syne clapt it to his pipe. 1893 R. O. HESLOP Northumberland Words s.v. Moudy, Tell Jack the moudy to come o' Monday.    II. Compounds.    3. mowdie-hill, a mole hill. mowdie hillock = mowdie-hill. mowdie-man = sense 2.

Page 40: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

SVILUPPI SUCCESSIVI

Primo supplemento (4 volumi, 1955 1986) Distinzione main / subordinate scompare Molte subject labels aggiuntive

OED2 (1984 1989) Versione elettronica su CD-ROM 20 volumi, 500000 definizioni,

OED3 (1993 2010): www.oed.com

Page 41: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

STORIA DEI DIZIONARI ITALIANI

VOCABOLARIO DEGLI ACCADEMICI DELLA CRUSCA (1612 1729/38) Primo dizionario storico in Europa Obiettivo: ‘fissare’ la lingua 1612: 30000 voci

Francesco D’Alberti di Villanuova (1797-1805) Primo dizionario a registrare termini tecnici

TOMMASEO-BELLINI (1865-1879) Ultimo vocabolario storico disponibile Collaboratori molto validi per voci specialistiche Etimologie spesso fantasiose

GRANDE DIZIONARIO DELLA LINGUA ITALIANA (1961 ??) Battaglia , poi Barberi Squarotti

Page 42: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DIZIONARI TRADIZIONALI IN FORMA ELETTRONICA

Zingarelli interattivo (Zanichelli)

Page 43: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

ALTRI TIPI DI DIZIONARI

Dizionari ETIMOLOGICI Concentra solamente su derivazione delle

parole LEI Lessico Epistemologico Italiano (Max Pfister,

in completamento) Dizionari dei SINONIMI e dei CONTRARI

Tommaseo, 1830 Dizionari BILINGUI

Basati su coppie di ETERONIMI

Page 44: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

DIZIONARI ONOMASIOLOGICI/ TESAURI

Dizionario ONOMASIOLOGICO: parole raggruppate per SOGGETTI invece che in ordine alfabetico I dizionari Italiani piu’ antichi sono in

questa forma (Alunno, 1548) TESAURI

Peter Mark Roget, THESAURUS OF ENGLISH WORDS AND PHRASES (1852)

Page 45: INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Dizionari: contenuti e storia

LETTURE

Jackson, cap. 2-6 Morello, cap. 4 Per saperne di piu’:

Jonathon Green, Chasing the Sun Simon Winchester, The surgeon of

Crawthorne (vita di Minor)