lexicon-het geheugen en predictie bij spreken verstaan en lezen

W O O R D E N O N D E R E L K A A R

Koninklijke Nederlandse Akademie van WetenschappenPostbus 19121, 1000 GC Amsterdam T 020-551 07 00 F 020-620 49 41 E [email protected], www.knaw.nl

Voor het bestellen van publicaties: T 020-551 07 80 E [email protected]

isbn 90-6984-470-2

Het papier van deze uitgave voldoet aan iso-norm 9706 (1994) voor permanent houdbaar papier

2006 Koninklijke Nederlandse Akademie van Wetenschappen (knaw). Niets uit deze uitgave mag worden verveelvuldigd en/of openbaar ge maakt door mid del van druk, fotokopie, via internet of op welke wijze dan ook, zonder voor af gaan de schriftelijke toestemming van de rechthebbende, be hou dens de uit zon de rin gen bij de wet gesteld.

Rede uitgesproken bij de aanvaarding van het ambt van bijzonder hoogleraar in de kwantitatieve taalkunde vanwege de Stichting Akademieleerstoelen Geesteswe-tenschappen van de Koninklijke Nederlandse Akademie van Wetenschappen.Radboud Universiteit Nijmegen, 3 februari 2006.

pagina2.indd 2pagina2.indd 2 13-1-2006 9:44:2713-1-2006 9:44:27Process BlackProcess Black

R O L F H A R A L D

B A A Y E N

. . . . . . . . . . . . . . . . . . . . .

W O O R D E N

O N D E R

E L K A A R

Geheugen en predictiebij spreken, verstaan en lezen

K O N I N K L I J K E N E D E R L A N D S E A K A D E M I E V A N W E T E N S C H A P P E N

Amsterdam, 2006

Mijnheer de Rector Magnificus,Leden van de Commissie Akademieleerstoelen Geesteswetenschappen van deKoninklijke Nederlandse Akademie van Wetenschappen,Leden van het curatorium van deze bijzondere leerstoel,Zeer gewaardeerde toehoorders,

In 1864 verscheen een Nieuw Woordenboek der Nederlandsche Taal, dat in suc-cessievelijke bewerkingen en uitbreidingen in de volksmond bekend is komen testaan als de dikke Van Dale. Dit prachtige woordenboek biedt een schat aaninformatie over vele tienduizenden woorden die in het Nederlandse taalgebiedgebruikt worden of werden. Voor een knaagdier dat 16 tot 24 centimeter lang is,en waarvan het grootste gedeelte van de lengte op rekening komt van de staart,biedt mijn editie uit 19611 op bladzijde 1627, kolom twee, het woord rat, onderrasverbetering en voor rata.

rasverbetering, v., verbetering, veredeling van een ras: slechts driebijesoorten komen in aanmerking voor rasverbetering; . . .

rat, v. (m.) (-ten), 1. knaagdier . . .rata, (Lat. rata pars, evenredig deel), in: pro rata, naar rata (van),

naar verhouding, naar evenredigheid van . . .

Van Dale biedt, naast een aantal betekenisomschrijvingen, ook informatie over deverschijningsvormen van het woord rat. Zo vermeldt het dat het enkelvoud rateen meervoud heeft dat met dubbel T gespeld wordt, ratten. Dit lijkt overbodigeinformatie, maar woorden die rijmen op rat, bijvoorbeeld wad en bad, hebbenin het meervoud een D in plaats van een T, en in het geval van baden ook nogklinkerverandering van A naar AA. Voorts noemt Van Dale het verkleinwoord,ratje en het bijbehorende meervoud ratjes. Tenslotte vermeldt het twee samenstel-lingen met rat, huisrat en zwerfrat, de volgens Van Dale belangrijkste twee soortenratten.

Van Dale biedt nog veel meer informatie over dit intelligente knaagdier. Eendeel van deze informatie is verspreid over de bladzijden volgend op rat, voor zoverhet samenstellingen betreft die met rat beginnen. Tussen woorden als ratelklep-per, rats en ratuig vinden we onder meer ratijzer (een ijzeren knip om ratten tevangen), ratdicht (onbereikbaar voor ratten), rattebeet, rattehol, rattenvanger, rat-testaart en rattenbestrijding. Maar rat heeft nog meer morfologische familieleden,verspreid door het hele woordenboek heen, van bergrat tot zeerat (overigens geen

5

knaagdier, maar een vis). Dit soort woorden konden we vroeger uitsluitend op-sporen met een retrograde woordenboek, zoals dat van Nieuwborg uit 1978.2 Indit woordenboek, niet meer dan een ingebonden versie van de computeruitdraaivan een sorteerprogramma, vinden we wederom vele ratten onder elkaar, maar nuis er andersoortig kaf tussen het koren.

RATKRAT

DAKRATZAKRAT

TREKRATWAGENKRAT

FLESSENKRATKERKRAT

ACHTERKRAT

U merkt bij het lezen van dit rijtje woorden dat het lastig wordt de ratten teonderscheiden van de kratten. Er zit een rat in krat, naast kat en at. Van dit soortingebedde woorden hebben we bij het lezen aantoonbaar last, al merkt u daaralleen wat van bij het zoeken in een retrograde woordenboek.3

Een woord dat bij velen van u inmiddels door het hoofd zal zijn gegaan ismuis. De dikke Van Dale beschrijft de rat als een knaagdier van de familie dermuizen, maar voor systematische informatie over woorden die betekenisverwant-schap hebben met rat, anders dan woorden met rat, moeten we te rade gaan bijeen synoniemenwoordenboek, dat woorden ordent naar betekenis in plaats vannaar vorm.

Woordenboeken bevatten schatten aan informatie, maar die informatie isslecht toegankelijk. Woorden moeten volgens n of ander ordeningsprincipeonder elkaar gezet worden, zodanig dat de gebruiker een systematische zoektochtkan ondernemen. Deze vaak domweg vervelende zoektochten in de woorden-boeken contrasteren met het gemak waarmee wij doorgaans onze gedachten inwoorden weten uit te drukken bij het spreken, en het gemak waarmee we bij hetlezen of luisteren de betekenissen van woorden weten te achterhalen.

Wat zijn de organisatieprincipes voor woorden en hun betekenissen in onsgeheugen die deze snelle en doorgaans zeer efficinte lexicale verwerking mogelijkmaken? Over het antwoord op deze vraag wordt zeer verschillend gedacht. Latenwe beginnen met ons oor te luisteren te leggen bij de taalkunde.

6

Het lexicon in de taalkunde

In de taalkunde hebben formele talen lange tijd model gestaan voor theorienvan het lexicon. Een formele taal bestaat uit een verzameling basisbouwstenen enregels om deze bouwstenen tot reeksen samen te voegen. U kunt hierbij denkenaan uw zakrekenmachine: de bouwstenen zijn de getallen, haakjes en tekens voorvermenigvuldigen, optellen, delen, enzovoorts. Dankzij de ingeprogrammeerderekenregels kunt u van getallen nieuwe getallen maken, zolang u maar niet doornul probeert te delen en de operatoren en haakjes op de juiste plaatsen inzet. Uwzakrekenmachine onthoudt niks, en berekent alles. U toetst 3 maal 3 in, en zijrekent 9 voor u uit. U toetst nogmaals 3 maal 3 in, en weer rekent ze 9 voor uuit. Nooit zal ze onthouden dat 3 maal 3 negen is. Ze is volmaakt in wat ze kan,maar daartegenover staat dat ze er ook nooit wat bij zal leren.

Volgens de generatieve taalkunde is het lexicon een taalkundige rekenmachi-ne. De amerikaanse geleerde Steven Pinker heeft deze visie op het lexicon gepopu-lariseerd met zijn boek Words and rules: the ingredients of language.4 VolgensPinker zou ook het lexicon bestaan uit een verzameling elementaire bouwstenen,de zogenaamde morfemen, gecombineerd met een verzameling regels die mor-femen samenvoegen tot woorden. De volgende mini-grammatica illustreert decentrale concepten van deze theorie.

MORFEMEN

rat, muiz, marmot, vogel, -en, -sMEERVOUDSREGEL

(i) draagt de laatste lettergreep van de stam klemtoon?(ii) zo ja, kies -en, zo nee, kies -s(iii) voeg -s of -en toe aan het eind van de stam

VERSTEMLOZINGSREGEL

maak B, D, V, Z aan het eind van de stam stemloos (P, T, F, S)indien tevens aan het eind van een lettergreep

Voor rat leiden we het meervoud ratten af, voor vogel het meervoud vogels. Voorhet meervoud van muis moeten we een noodgreep toepassen. Als we de vormmuis in onze lijst met morfemen zouden opnemen, zouden we ten onrechte hetmeervoud muisen afleiden, in plaats van muizen. Om dit te voorkomen, nemenwe muis op als muiz (en luis als luiz, huis als huiz, sluis als sluiz, maar kruis weergewoon als kruis), samen met een extra regel, de verstemlozingsregel, die waarnodig de stemhebbende Z omzet in een stemloze S.

7

Een cruciale veronderstelling in deze theorie is dat alle eerdere ervaring metmeervouden is geabstraheerd in de meervoudsregel en de stemloosheidsregel.5 Netzoals uw zakrekenmachine geen resultaten onthoudt, zo zou ons geheugen nietsonthouden van de meervoudsvormen die het ooit eerder heeft gezien, gehoordof uitgesproken. Alle eerdere ervaring met complexe woorden zou uitsluitend enalleen samengebracht zijn in abstracte regels. In het vervolg zal ik de verzamelingtaalkundige en psycholingustische modellen die dit principe aanhangen, aandui-den als strikt decompositionele modellen.

Deze benadering van taal is ontstaan in de zestiger en zeventiger jaren vande vorige eeuw, en weerspiegelt de informatietechnologie van die tijd. Compu-tergeheugen was schaars en zeer kostbaar. Bij het schrijven van computerpro-grammas was het cruciaal om zo zuinig mogelijk met het geheugen om te gaan,en zoveel mogelijk via generalisaties te beregelen. Tegenwoordig hebben we wel-haast geheugen te over, en blijken algorithmen die generaliseren over gigantischehoeveelheden opgeslagen voorbeelden, verrassende nieuwe mogelijkheden te bie-den. Binnen de computationele taalkunde biedt het werk van geleerden als RensBod, Walter Daelemans en Antal van den Bosch hiervan inspirerende voorbeel-den.6

Dat het contraproductief is de rol van het geheugen te beperken tot het ont-houden van alleen morfemen en hun combinatieregels, heeft ook de amerikaansegeleerde Joan Bybee laten zien aan de hand van tal van subtiele verschijnselen intaal en taalverandering. Laten we daarom overstappen van het generatieve lexiconnaar wat het experimenteel onderzoek ons heeft geleerd over de rol van geheugen-sporen voor regelmatige gelede woorden.

Geheugensporen voor regelmatige gelede woorden

Het bekende gezegde oefening baart kunst wijst op de belangrijke rol van erva-ring bij het leren van nieuwe vaardigheden. Het leren van woorden vormt hieropgeen uitzondering. Hoe vaker we een woord tegenkomen, hoe beter het in onsgeheugen blijft zitten. Een ieder die wel eens woordjes heeft moeten leren ineen vreemde taal, weet uit ervaring hoe lastig het is om woorden die weinig ge-bruikt worden, toch goed te onthouden. Het is dan ook niet verwonderlijk datin het experimentele onderzoek naar het mentale lexicon, de frequentie waarmeeeen woord voorkomt in de taal een belangrijke voorspeller is gebleken van de

8

verwerkingssnelheid. Hoe frequenter een woord is, hoe sneller je het herkent, enhoe sneller je het kunt uitspreken.7

Hoe zit het nu met de verwerkingstijd voor gelede woorden als rattenvanger enhotelrat? Het woord rattenvanger komt veel vaker voor dan het woord hotelrat. Inhet licht van het frequentie-effect verwachten we dat rattenvanger sneller verwerktwordt dan hotelrat. Maar dan veronderstellen we wel dat rattenvanger en hotel-rat zelfstandige eenheden zijn, elk met hun eigen geheugenspoor en hun eigenfrequentie. Echter, als regelmatige gelede woorden geen eigen geheugensporenhebben, zoals in strikt decompositionele modellen wordt aangenomen, dan moe-ten de gebruiksfrequenties van regelmatige gelede woorden wel irrelevant zijn. Inplaats daarvan zouden de samenstellende morfemen de cruciale dragers van hetfrequentie-effect moeten zijn. Een voorbeeld moge dit verduidelijken.

Tabel 1 biedt een overzicht van de morfologische familie van de rat. Voorelk van haar 21 familieleden vermeldt de tabel de frequentie van dat familielid ineen verzameling teksten met in totaal 42 miljoen woorden.8 Als deze familieledeneigenlijk helemaal niet in het mentale lexicon bestaan, omdat ze aldoor opnieuwontleed of in elkaar gezet worden, dan moeten we aannemen dat hun frequentiesgerfd worden door de morfemen waaruit ze zijn opgebouwd. Elke keer dat wehet morfeem rat tegenkomen, op zichzelf of in een ander woord, wordt de fre-quentieteller voor rat opgehoogd. Voor de rat betekent dit dat haar frequentie van994 met de gezamenlijke frequentie van al haar familieleden, 163, moet wordenopgehoogd tot 1157. Volgens strikt decompositionele modellen zou deze gesom-de frequentie de enig juiste frequentiemaat zijn om de lexicale verwerkingstijdvan rat mee te voorspellen. Voor samenstellingen zoals hotelrat zou de verwerking

Tabel 1: De morfologische familie van de rat. Frequenties gebaseerd op een tekst-verzameling van 42 miljoen woorden. N: zelfstandig naamwoord, V: werkwoord.

beverrat 2 rattegezicht 2 rattenprobleem 3buidelrat 6 rattehol 5 rattenvanger 29hotelrat 2 rattekop 2 rattenverdelger 2kerkrat 5 rattengif 5 ratteval 6muskusrat 33 rattenkoning 19 waterrat 13rat (N) 994 rattenkruit 5 woelrat 10ratten (V) 4 rattenplaag 4 woestijnrat 6

9

dan bepaald worden door de frequenties van de samenstellende morfemen, degesomde frequentie van hotel en de gesomde frequentie van rat.

Verschillende experimenten hebben aangetoond dat deze voorspelling nietuitkomt. Bij het lezen van het woord rat, zo hebben we in ons lab kunnen vast-stellen,9 is de gesomde frequentie van de familieleden helemaal niet van belang.In plaats van de gesomde frequentie van de 21 familieleden van rat 1157 blijkt het aantal familieleden zelf 21 de cruciale voorspeller te zijn. Hoegroter de morfologische familie, hoe korter de leestijden zijn. Hoe is dat mogelijkals de familieleden zelf niet opgeslagen zijn? Verder heeft Nivja de Jong in haarproefschrift laten zien dat bij samenstellingen zoals hotelrat en kerkrat, naast enonafhankelijk van de familie-effecten van rat, hotel en kerk, ook de frequentiesvan deze samenstellingen zelf goede voorspellers zijn van leestijden.10 Het lijkt eroverigens op dat u een geleed woord maar nmaal hoeft te horen of te lezen omhet al te onthouden, zo blijkt uit het promotieonderzoek van Laura de Vaan. Indeze rede heb ik tot nog toe nmaal eerder het woord zeerat gebruikt. Ook als udit woord nog nooit eerder was tegengekomen, herkent u het na n aanbiedingtoch onmiddelijk.

Voorstanders van decompositionele theorien zouden nu kunnen tegenwer-pen dat de betekenissen van samenstellingen zoals hotelrat, kerkrat en zeerat tochmoeilijk te voorspellen zijn uit hun samenstellende delen. Volgens Van Dale iseen kerkrat een rat die zich in de kerk ophoudt, is een hotelrat een nachtelijkehoteldief, en is een zeerat geen knaagdier en geen mens maar een vis. Er lijkt geenpijl te trekken op de betekenissen van de samenstellingen met rat. We moetendeze betekenissen domweg onthouden, ze moeten wel in het lexicon zijn opge-slagen. Het is deze onontkoombare opslag die, aldus strikt decompositionele the-orien, verklaart waarom er een woordfrequentie-effect voor dit soort complexewoorden gevonden wordt en waarom veel complexe woorden bijdragen aan hetfamiliegrootte-effect.

Deze redenering loopt spaak op de frequentie-effecten die we keer op keerhebben geobserveerd voor woorden die zowel qua betekenis als qua vorm volstrektregelmatig zijn, zoals meervouden van zelfstandige naamwoorden en vervoegingenvan regelmatige werkwoorden. Zo wordt bijvoorbeeld het meervoud ratten bijnatwee keer zo vaak gebruikt als het enkelvoud rat. Dankzij deze hoge frequentiewordt het (langere) meervoud bijna net zo snel gelezen en verstaan als het (kor-tere) enkelvoud. Meervouden die veel minder frequent zijn dan hun enkelvoudvergen doorgaans veel langere leestijden.11 Ook voor volstrekt regelmatige geledewoorden geldt klaarblijkelijk dat we uit ervaring wijs worden.

10

Uit het promotieonderzoek van Heidrun Bien naar de productie van samen-stellingen12 blijkt eveneens dat strikt decompositionele modellen tekort schieten.Zij gebruikte in haar experimenten samenstellingen waarvan de betekenis welvoorspelbaar is. Bovendien gebruikte ze een productietaak waarin de rol van hetconceptualisatieproces, zo niet geheel dan toch grotendeels, werd uitgeschakeld.Toch bleek dat de frequentie van een samenstelling als geheel mede de snelheidvoorspelt waarmee deze uitgesproken wordt.

De aanwezigheid van woordspecifieke geheugensporen in het mentale lexi-con wordt verder ondersteund door studies die de details van het spraaksignaalnader onder de loep nemen. Mark Pluymaekers laat in zijn promotieonderzoekzien dat de duur van voor- en achtervoegsels in het acoustisch signaal afneemtbij toenemende woordfrequentie.13 Hij vroeg proefpersonen afgeleide woordenzoals ontvlammen en verplaatsen hardop voor te lezen. Ze kregen deze woordenop een beeldscherm aangeboden in een langzaam tempo met 1500 millisecondenper woord, een sneller tempo met 1100 milliseconden per woord, en een heelsnel tempo met slechts 700 milliseconden per woord. Zoals verwacht, sprakende proefpersonen de woorden korter uit naarmate het tempo van het experimentwerd opgevoerd. Onafhankelijk van het tempo bleken ze ook de voor- en achter-voegsels korter uit te spreken naarmate de frequentie van het gelede woord hogerwas. Het gaat hier echt om de frequentie van het gelede woord zelf. De frequen-tie van de stam had geen enkele voorspellende waarde. Vergelijkbare resultatenverkreeg Mark Pluymaekers niet alleen onder laboratoriumcondities, maar ookvoor spontane spraak zoals beschikbaar in het Corpus Gesproken Nederlands.14

Strikt decompositionele modellen doen dus precies de verkeerde voorspellingenvoor hoe wij gelede woorden uitspreken. Ze voorspellen dat de frequenties vande delen de uitspraak bepalen, maar die zijn irrelevant. En ze voorspellen dat defrequentie van het geheel irrelevant is, maar die heeft nu juist bij uitstek voorspel-lende kracht.

Het belang van het verband tussen stam en affix binnen het woord blijkt ookuit ons onderzoek naar frequentie en assimilatie. Mirjam Ernestus15 onderzochthet spraaksignaal van gelede woorden zoals wetboek. Volgens de handboeken16

wordt de stemloze T van wet onder invloed van de stemhebbende B van boek ookstemhebbend: WEDBOEK. Uit een grondige analyse van het Corpus GesprokenNederlands bleek echter dat deze regressieve assimilatie maar in de helft van degevallen optreedt, en dat in een kwart van de gevallen zelfs progressieve assimi-latie optreedt (WETPOEK). Verder bleek dat de kans op assimilatie, regressiefn progressief, toeneemt naarmate het gelede woord frequenter is. Dit woord-

11

specifieke karakter van assimilatie is volstrekt in strijd met de voorspellingen vanstrikt decompositionele modellen van het mentale lexicon, en vormt het zoveelstebewijs voor het bestaan van geheugensporen voor gelede woorden.

Deze laatste voorbeelden illustreren een verschijnsel dat bekend staat als nvan de wetten van Zipf: woorden worden korter bij intens gebruik.17. Op macro-nivo wordt televisie verkort tot teevee, en vervangt auto de langere vorm automobiel.Op micronivo wordt verplaatsen verkort tot FPLASE, en neemt FOEBAH de plaatsin van voetbal. Naarmate woorden frequenter zijn, worden we gemakzuchtiger bijde uitspraak. Hierdoor vervagen de verschillen tussen de klanken op de grenzentussen morfemen, en worden ook morfemen zelf vereenvoudigd dankzij het weg-vallen van klanken.

Geheugen en (on)regelmaat

Zowel woordfrequentie-effecten bij lezen, luisteren en spreken als ook de detailsvan het acoustisch signaal wijzen erop dat regelmatige gelede woorden hun eigensporen achterlaten in ons geheugen. Maar als dat zo is, hoe zit het dan met hetverschil tussen bijvoorbeeld regelmatige en onregelmatige werkwoorden? Regel-matige werkwoorden onderscheiden zich toch van onregelmatige werkwoorden,hierin dat een regelmatige verleden tijd wel, maar een onregelmatige verleden tijdniet van de tegenwoordige tijd wordt afgeleid?

Het overzicht in Tabel 2 brengt de verschillen in kaart tussen een strikt de-compositioneel model (links) en een model met geheugensporen voor complexe

Tabel 2: Schematisch overzicht van de werkwoordsvormen in een decomposi-tioneel lexicon en in een lexicon met geheugensporen voor regelmatige geledewoorden.

DECOMPOSITIONEEL MODEL

MODEL MET GEHEUGENSPOREN

tegenwoordige verleden tegenwoordige verledentijd tijd tijd tijd

regelmatig hoop hoop hoopteonregelmatig loop liep loop liep

12

woorden (rechts), aan de hand van de werkwoorden hopen (regelmatig) en lopen(onregelmatig). Een strikt decompositioneel lexicon bevat de stammen hoop enloop. Voor het onregelmatige werkwoord lopen bevat het daarnaast ook de stamvoor de onregelmatige verleden tijd, liep. Voor regelmatige verledentijdsvormenbevat het strikt decompositionele lexicon geen vorm. De regelmatige verledentijdsvormen moeten worden afgeleid van het werkwoord in de tegenwoordige tijd.In modellen met geheugensporen voor regelmatige woorden is dit niet nodig, enwellicht zelfs niet wenselijk.

Hoe zouden we experimenteel kunnen toetsen dat de regelmatige verledentijdsvorm wel of juist niet afgeleid wordt van de tegenwoordige tijdsvorm? Eentaak die veel gebruikt is om dit verschil zichtbaar te krijgen is een voorleestaakwaarin proefpersonen de tegenwoordige tijd op het beeldscherm krijgen aangebo-den, en daarna zo snel mogelijk de corresponderende verleden tijdsvorm moetenuitspreken. Men ziet loop of hoop en moet liep of hoopte zeggen. De taak bootstde gang van zaken na in het generatieve lexicon: begin bij de tegenwoordige tijd,en leid dan de verleden tijd af.

Deze taak ziet er heel natuurlijk uit, woordenboeken spellen toch ook deregelmatige verleden tijdsvormen niet in detail uit? En toch is deze taak ongelofe-lijk lastig. Proefpersonen verhaspelen regelmatige en onregelmatige werkwoorden,en melden geregeld na afloop van het experiment dat ze geschokt zijn over hoeveelfouten ze maakten.

Waarom is deze taak zo lastig? In het strikt decompositionele model moetde oorzaak gezocht worden bij specifiek de onregelmatige werkwoorden. Bij diewerkwoorden zijn de verleden tijdsvormen in het lexicon aanwezig, en moetendaarin worden opgezocht. Bij dat opzoeken kan van alles mis gaan. Bijvoorbeeld,bij rijmende werkwoorden zoals loop en koop kan er verwarring ontstaan omdatde corresponderende verleden tijdsvormen heel verschillend zijn: liep voor loop,maar kocht voor koop.

Maar er is veel meer aan de hand, zo laat Wieke Tabak in haar promotie-onderzoek zien. Het blijkt dat de vorm die men ziet, de vorm die men moetuitspreken in de weg zit. En dit niet alleen bij onregelmatige werkwoorden, maarnet zo goed bij regelmatige werkwoorden. Het kost meer tijd om de verledentijdsvorm uit te spreken naarmate de op het beeldscherm getoonde tegenwoordi-ge tijdsvorm frequenter en de verleden tijdsvorm minder frequent is. Draaien wede taak om, zodat proefpersonen een verleden tijdsvorm zien, en de tegenwoor-dige tijdsvorm moeten uitspreken, dan zien we hetzelfde gebeuren. Nu geldt dathoe frequenter de verleden tijd die men ziet is ten opzichte van de tegenwoordige

13

Figuur 1: Een regelmatig werkwoord (huilen, links) en een onregelmatig werk-woord (zingen) zoals uitgebeeld voor het plaatjesbenoemingsexperiment van Wie-ke Tabak.

tijd die men moet zeggen, des te langer de benoemingstijden zijn. Opmerke-lijk is dat er geen enkele aanwijzing in deze experimenten is dat het effect vande frequentieverhouding van de getoonde en de uitgesproken vorm anders zouzijn voor regelmatige en onregelmatige werkwoorden.18 Deze resultaten bevesti-gen dat regelmatige werkwoordsvormen hun eigen geheugensporen hebben, en indit opzicht niet verschillen van onregelmatige werkwoorden.

Voor onderzoek naar de productie van gelede woorden hebben dit soort voor-leestaken twee vervelende nadelen. Ten eerste meten voorleestaken niet alleenproductieprocessen maar ook processen van de visuele waarneming. Ten tweedezegt de voorleestaak het woord als het ware voor, en geeft daarom geen inzicht inde normale gang van gedachte tot uitspraak.

In een reeks vervolgexperimenten vroegen we daarom proefpersonen op fotosuitgebeelde handelingen te benoemen (zie Figuur 1). Anders dan gebruikelijkmaakten wij onze proefpersonen niet van te voren met de fotos vertrouwd engaven we ze geen intructies over hoe ze de fotos moesten benoemen. Anders zoude taak toch weer erg gaan lijken op de voorleestaak, waarin het uit te sprekenwoord ook aan de proefpersoon wordt verklapt.

14

In een eerste experiment vroegen we proefpersonen de handeling te benoemenmet de infinitief, als antwoord op de vraag wat doet ze? zingen. Vervolgens kregenproefpersonen in n experiment eerst het woord vandaag en in een ander experi-ment eerst het woord gisteren te zien, waarna de foto werd getoond. We vroegende proefpersonen zo snel mogelijk te antwoorden met zingt ze dan wel zong ze.

In overeenstemming met onze verwachting was er in deze conceptueel ge-stuurde experimenten geen enkel spoor te bekennen van tegenwoordige en verle-den tijdsvormen die elkaar in de weg zitten. De belangrijkste maat voor het voor-spellen van de plaatjesbenoemingstijden in deze experimenten was de onzekerheidover het uitgebeelde werkwoord (gekwantificeerd met behulp van Shannons en-tropie, berekend over de relatieve frequenties van de in het experiment gekozenalternatieven). Een tweede buitengewoon robuuste predictor was of de laatstemedeklinker van de stam zowel stemloos als stemhebbend voorkomt, of alleenstemloos (vergelijk Tabel 3). Proefpersonen deden er langer over om werkwoor-den zoals graven en zweven te benoemen dan werkwoorden zoals zitten en ruisen.Om het werkwoord goed uit te spreken moeten we uit ons geheugen ophalen hoede laatste medeklinker van de stam moet worden uitgesproken. Als hier meerderemogelijkheden zijn, moet een keuze gemaakt worden is het ZWEVEN of ZWE-FEN en het maken van deze keuze kost tijd. Het is interessant dat dit aspectvan de planning van de vorm van werkwoorden in onze experimenten zeer signi-ficant aanwezig is, terwijl het verschil tussen sterke en zwakke werkwoorden nujuist volstrekt geen enkele voorspellende waarde heeft. In strikt decompositionelemodellen zijn deze resultaten moeilijk te verklaren. Waarom zou de planning vaneen subtiel detail als de stemhebbendheid van de laatste medeklinker van de stam

Tabel 3: Voorbeelden van regelmatige en onregelmatige werkwoorden waarvan delaatste medeklinker van de stam altijd stemloos is (links) dan wel zowel stemloosals stemhebbend kan zijn (rechts).

ALLEEN STEMLOOS STEMLOOS EN STEMHEBBEND

onregelmatig regelmatig onregelmatig regelmatigzit ruis graaf zweefzitten ruisen graven zwevenzat ruiste groef zweefdezaten ruisten groeven zweefden

15

wel van belang zijn, maar niet het veronderstelde fundamentele cognitieve verschilin planning voor onregelmatige werkwoorden (het ophalen van de stam uit het ge-heugen) en regelmatige werkwoorden (het toepassen van een morfologische regel)?

Deze resultaten hebben verstrekkende gevolgen voor de lingustische theo-rievorming. Vanaf de vijftiger jaren zijn taalkundige modellen ervan uitgegaandat ingewikkelde vormen worden afgeleid van eenvoudiger vormen.19 Maar alscomplexe woorden hun eigen geheugensporen hebben, dan is het niet alleen nietnodig om woorden on-line van elkaar af te leiden, het is zelfs disfunctioneel omdat te doen. Stel dat we zweefde willen afleiden van zweef, terwijl we zweefde ookal in ons lexicon hebben. Dan zijn we in precies dezelfde positie als proefper-sonen die de tegenwoordige tijd op het scherm zien, en de verleden tijd moetenuitspreken. De ene vorm zit de andere domweg in de weg. En dit niet alleen het zou wel eens zo kunnen zijn dat hoe frequenter de tegenwoordige tijd is, hoemoeilijker het wordt die tegenwoordige tijd om te vormen tot een verleden tijd.Men heeft altijd stilzwijgend als vanzelfsprekend aangenomen dat men kosteloosde ene vorm kan activeren als startpunt voor verdere afleidingsprocessen. Onzeexperimenten stellen deze aanname fundamenteel ter discussie. Wat we nodighebben is een theorie zonder afleidingen, een theorie waar zweefde direct vanuitde betekenis toegankelijk is, en niet pas via de omleiding van de tegenwoordigetijd zweef.20

Maar is deze conclusie niet in strijd met de indrukwekkende lijst van ver-schijnselen die volgens Steven Pinker zouden bewijzen dat woordvorming wezen-lijk derivationeel van aard zou zijn, en gegrondvest op morfemen en regels?

Steven Pinker onderbouwt zijn derivationele theorie met argumenten die hijontleent aan zowel de taalkunde, als aan de neurocognitie en de taalpathologie.De taalkundige argumenten vormen samen een briljant kaartenhuis, gebaseerdop een wel zeer selectieve lezing van de literatuur. Ik geef een voorbeeld. Vol-gens Pinker hebben morfologische regels geen toegang tot de betekenissen vanwoorden. Deze stellingname onderbouwt hij als volgt.21 In het Engels zijn erwoorden die qua betekenis dicht bij elkaar liggen, zoals slap, hit, and strike. Maarbij dit soort woorden met vergelijkbare betekenis vinden we zowel regelmatigeals onregelmatige werkwoorden. Omgekeerd is er bij onregelmatige werkwoor-den die wel steeds dezelfde klinkerwisseling vertonen geen sprake van duidelij-ke betekenisovereenkomsten, zoals blijkt uit bijvoorbeeld sing/sang, drink/drank,shrink/shrank, spring/sprang, stink/stank and ring/rang. Uit deze informele observa-tie leiden Pinker en zijn collegas af dat morfologische regelmaat beperkt zou zijntot eigenschappen van de woordvorm.

16

Dat er met deze conclusie iets fundamenteel mis is, blijkt al hieruit dat Pinkeren de zijnen voorbij gaan aan de in descriptieve grammaticas van het Engels22 be-kende observatie dat veel namen van dieren waarop voor voedsel wordt gejaagd, inhet Engels geen meervoudsuitgang krijgen: grouse, snipe, sheep, moose, deer, plaice,salmon, cod en hake hebben als meervoud grouse, snipe, sheep, moose, deer, plaice,salmon, cod en hake.

Verder blijkt bij nadere bestudering dat regelmatige en onregelmatige werk-woorden wel degelijk, zij het op een subtieler manier, van elkaar verschillen inbetekenis. Sommige van deze verschillen zijn zo subtiel, dat ze alleen met behulpvan lexicale statistiek aan het licht gebracht kunnen worden, zoals ik samen metFermn Moscoso del Prado Martn heb laten zien.23 Onregelmatige werkwoor-den hebben meer synoniemen dan regelmatige werkwoorden. En de synoniemenvan onregelmatige werkwoorden zijn vaak zelf weer onregelmatig. Met anderewoorden, onregelmatige werkwoorden bewonen dichter bevolkte buurten in desemantische ruimte, en zoeken in die buurten elkaar op. Het is dus geen blindtoeval dat de beide leden van woordparen als geven/nemen en gaan/komen allebeionregelmatig zijn.24

Het eerder besproken experiment van Wieke Tabak waarin we proefperso-nen vroegen fotos te benoemen leerde ons nog iets nieuws over de semantischeverschillen tussen regelmatige en onregelmatige werkwoorden. Hoewel de ma-kers van de fotos uiteindelijk ongeveer evenveel regelmatige als onregelmatige fo-tos aanleverden, rapporteerden zij dat regelmatige werkwoorden veel lastiger uitte beelden waren dan onregelmatige werkwoorden. Dat er een verschil in uit-beeldbaarheid bestaat tussen regelmatige en onregelmatige werkwoorden werd optweerlei wijze bevestigd.

In de eerste plaats bleek uit de groottes van de JPG bestanden dat de fotosvan de regelmatige werkwoorden meer bytes in beslag namen dan de fotos van deonregelmatige werkwoorden. Onregelmatige werkwoorden zijn blijkbaar makke-lijker uit te beelden met simpele houdingen, en vereisen minder extra voorwerpenom de handeling te verduidelijken. In de tweede plaats benoemden de proefper-sonen de fotos voor regelmatige werkwoorden met meer verschillende werkwoor-den dan het geval was voor de onregelmatige werkwoorden. Proefpersonen warenblijkbaar minder zeker over welke handeling bedoeld was bij fotos van regelmatigewerkwoorden.

In het algemeen geldt dat onregelmatige werkwoorden met name fundamen-tele begrippen uitdrukken, terwijl regelmatige werkwoorden in hetzelfde bete-kenisveld doorgaans duiden op meer gespecialiseerde handelingen. Zo is lopen

17

Tabel 4: Basiswerkwoorden voor posities en bewegingen in het Nederlands en hetEngels. Onregelmatige werkwoorden zijn met hoofdletters weergegeven, regelma-tige werkwoorden met kleine letters.

werkwoorden van positie

{LIG ZIT STA leun HANG DRIJF zweefLIE SIT STAND LEAN HANG float hover

werkwoorden van beweging

{LOOP KRUIP SPRING ren ZWEM ZINK DUIKwalk crawl SPRING RUN SWIM SINK DIVE

{RIJD VLIEG KLIM STIJG daal VALRIDE FLY climb ascend descend FALL

onregelmatig, maar zijn kuieren, wandelen, slenteren, rennen en hollen regelmatig.Als we vervolgens de fundamentele werkwoorden voor posities en bewegingen bijelkaar plaatsen zoals in Tabel 4, dan is de oververtegenwoordiging van de onre-gelmatige werkwoorden opvallend. Bij de meeste van deze werkwoorden is hetmenselijk lichaam het prototypisch subject. In het licht van deze twee observa-ties is het niet langer verwonderlijk dat onregelmatige werkwoorden makkelijkeruitbeeldbaar zijn dan regelmatige werkwoorden.

Ik heb u laten zien dat vorm en betekenis in de morfologie niet zo strikt ge-scheiden zijn als wel is gedacht. Deze conclusie blijft niet zonder gevolgen voorde interpretatie van de resultaten uit de neurocognitie en de taalpathologie diePinker voor zijn strikt decompositionele model aanvoert. Vraagt men proefper-sonen de verleden tijd uit te spreken die hoort bij een op het beeldscherm aan-geboden tegenwoordige tijd, dan blijken verschillende gebieden in de hersenenactief te zijn voor regelmatige en onregelmatige werkwoorden.25 De regelmatigewerkwoorden worden, aldus Pinker, verwerkt in delen van de hersenen die zichwijden aan regels, en de onregelmatige werkwoorden in delen van de hersenen dieverantwoordelijk zijn voor opslag.

Deze interpretatie is echter geenszins dwingend. Regelmatige en onregelma-tige werkwoorden verschillen, zoals we hebben gezien, niet alleen wat hun vor-

18

melijke regelmaat betreft, maar ook wat hun betekenis betreft. Daardoor is hetonduidelijk of verschillen in verwerking toegewezen moeten worden aan verschil-len in vorm of aan verschillen in betekenis. Dat verschillen in betekenis inderdaadin het spel zouden kunnen zijn wordt gesuggereerd door onderzoek naar mensendie getroffen zijn door een hersenbloeding. Patinten die met name problemenhebben met de betekenissen van woorden, blijken ook extra moeite te hebben metuitgerekend de onregelmatige werkwoorden.26

Verder zijn regelmatige werkwoorden qua klankopbouw ingewikkelder danonregelmatige werkwoorden. De verleden tijd van loop is liep, een eenvoudigeopeenvolging van een medeklinker, een klinker en een medeklinker. Maar deverleden tijd van hoop is hoopte, een vorm waarin de P en de T direct na elkaarmoeten worden uitgesproken. Verschillen in hersenactiviteit tussen regelmatigeen onregelmatige werkwoorden zijn vermoedelijk mede tot dit soort verschillenin het gemak van uitspreekbaarheid te herleiden.27

Geheugensporen en paradigmatische verbanden

We hebben gezien dat het bewijsmateriaal voor het model van Steven Pinker aanalle kanten rammelt. Echter, als we ons model van het mentale lexicon niet voor-zien van morfemen en regels, en regelmatige verleden tijden niet meer willen aflei-den van tegenwoordige tijden, hoe moeten we dan de regelmaat in de woordbouwbeschrijven en verantwoorden? Wat voor model komt er voor in de plaats?

Ik zal vandaag niet veel meer kunnen bieden dan een eerste aanzet tot eenantwoord op deze vraag. Deze eerste aanzet begint met te constateren dat wetot nog toe gesproken hebben over woorden als waren het volstrekt onafhankelij-ke eenheden. We zijn zulke onafhankelijke eenheden gewend uit onze papierenwoordenboeken, waar elk woord haar eigen stukje tekst heeft. Maar hoe onaf-hankelijk van elkaar zijn woorden eigenlijk? De subtiele verschillen in betekenistussen regelmatige en onregelmatige werkwoorden wijzen erop dat de relaties diewoorden onder elkaar aangaan een principile plaats verdienen in de theorievor-ming.

In zijn Course de linguistique gnrale uit 1916 maakte Ferdinand de Saus-sure het beroemde onderscheid tussen syntagmatische en paradigmatische verban-den. Bij de syntagmatiek gaat het om de verbanden die elementen van de taal bin-nen reeksen aangaan. Bij paradigmatische verbanden gaat het om dwarsverbanden

19

het

de

ratjekatje

padje

ratkat

pad

[rent

rende

]

[looptliep

]

Figuur 2: Een voorbeeld van syntagmatische (horizontale) verbanden en paradig-matische (vertikale) verbanden gebaseerd op grammatikaal geslacht, rijm, achter-voegsel, woordsoort en tijd.

tussen de elementen die op een bepaalde positie in een reeks kunnen voorkomen.Figuur 2 illustreert deze begrippen. De verbanden tussen de woorden in de zin-nen die ontstaan door in elke kolom n woord te kiezen zijn syntagmatisch vanaard. Een voorbeeld van een syntagmatische regel is dat in het Nederlands ver-kleinwoorden het lidwoord het vereisen. Paradigmatische verbanden zijn vertikaalweergegeven. De in Figuur 2 weergegeven verbanden geven overeenkomsten weerin grammatikaal geslacht, achtervoegsel, werkwoord en rijm. De woorden rat, katen pad, bijvoorbeeld, staan in een paradigmatisch verband dankzij hun rijm endankzij hun woordsoort.

Verreweg de meeste aandacht in de taalkunde en taalpsychologie is tot nogtoe gericht geweest op syntagmatische verbanden. Standaard morfologische re-gels proberen paradigmatische verbanden samen te vatten en te abstraheren totsyntagmatische relaties. Tabel 5 illustreert dit proces van abstractie voor de meer-voudsvorming in het Nederlands. De syntagmatische regel krijgt toegang tot deklemtoon van de lettergreep links van het achtervoegsel, en kiest -en indien dezebeklemtoond is, en -s indien deze onbeklemtoond is.

Van wezenlijk belang voor deze aanpak is dat eigenschappen van stammen dieniet in de regel zijn opgenomen per definitie niet relevant zijn. Voor de meer-voudsvorming in het Nederlands lijkt deze regel het op het eerste gezicht heelaardig te doen, maar problemen worden meteen al zichtbaar bij woorden als ladeen kade, die zowel een meervoud op -en als op -s kennen. Welk meervoud eenspreker kiest, is bij dit soort paren mede gebaseerd op de relatieve frequentie in deervaring van die spreker met de twee meervoudsvormen.28 Maar in strikt decom-

20

Tabel 5: Een syntagmatische regel voor de meervoudsvorming in het Nederlandsmaakt de keuze tussen -en en -s op grond van een abstracte eigenschap van destam, namelijk, of haar laatste lettergreep klemtoon draagt.

MEERVOUDEN KLEMTOONPATROON STAMACHTERVOEGSEL

RAT-en -enKAT-en -enKRAT-en -enTAfel-s -sBEzem-s -sMOEder-s -s

MEERVOUDSREGEL { -en -s

positionele modellen hebben sprekers dit soort informatie nu juist net niet tothun beschikking. En als zij die informatie wel tot hun beschikking zouden heb-ben, dan nog is het volstrekt onduidelijk hoe die informatie tot een syntagmatischkenmerk zou moeten worden gereduceerd.

Laten we daarom onze benadering van wat regels zijn eens helemaal omke-ren. In plaats van regels te benaderen vanuit de syntagmatiek, benaderen we zenu vanuit de paradigmatiek, en vatten ze op als on-line generalisaties over in hetgeheugen beschikbare voorbeelden. Als deze omgekeerde benadering van regels,die genspireerd is door het werk van de belgische geleerde Walter Daelemans,juist is, dan moet de lexicale verwerking mede gestuurd worden door de paradig-matische relaties die woorden onder elkaar onderhouden. Een aanzienlijk deelvan ons onderzoek gedurende de afgelopen jaren is gericht geweest op het expe-rimenteel zichtbaar maken van het belang van deze paradigmatiek. Wij hebbenons daarbij met name gericht op drie verschijnselen in de nederlandse morfologie:familiegroottes, de tussenklanken in samenstellingen, en de verstemlozingsregel.

In het Nederlands is werk de stam met het grootste aantal morfologische fami-lieleden, zon 550 in totaal. De stam rat, met slechts 21 familieleden, is duidelijkminder productief, maar nog altijd vele malen productiever dan de stam zeis, diehelemaal niet in afgeleide woorden of samenstellingen voorkomt. Ik heb er eerder

21

Tabel 6: De samenstellingen in de morfologische familie van de rat, geordendnaar de positie van rat links dan wel rechts, in de samenstelling. SOM: gesomdefrequentie in de positionele subfamilie, ENTROPIE: Shannons entropie berekendover de relatieve frequenties in de subfamilie.

LINKS RECHTS

rattegezicht 2 beverrat 2rattehol 5 buidelrat 6rattekop 2 hotelrat 2rattengif 5 kerkrat 5rattenkoning 19 muskusrat 33rattenkruit 5 waterrat 13rattenplaag 4 woelrat 10rattenprobleem 3 woestijnrat 6rattenvanger 29rattenverdelger 2ratteval 6SOM 82 77ENTROPIE 2.81 2.44

in deze lezing al op gewezen dat, met name bij het lezen, een grotere morfologi-sche familie tot snellere verwerking leidt. De rat leest sneller dan de zeis dankzijde aanwezigheid van paradigmatische relaties met onder meer rattenvanger, rat-tenplaag en dakrat. Met andere woorden, wat u verstaat als u leest wordt medebepaald door wat u niet leest.

Voor gelede woorden als rattenvanger en kerkrat is een verdere verfijning vanstamgebaseerde paradigmatiek noodzakelijk. Tabel 6 ordent de samenstellingenmet rat naar de positie van rat in de samenstelling: links of rechts. De laatstetwee regels van deze tabel geven twee positionele paradigmatische maten: de ge-somde frequentie waarmee rat links (82) dan wel rechts (77) voorkomt, alsmedeShannons entropie berekend over de verdelingen van de relatieve frequenties vande woorden in de linker en rechter positionele subfamilies. Heidrun Bien laat inhaar promotieonderzoek zien dat beide maten significante predictoren zijn voorde tijd die we nodig hebben om dit soort samenstellingen uit te spreken.29 Niet

22

de frequentie van rat als zodanig, maar de frequentie en entropie van rat gecondi-tioneerd op de positie van rat in de samenstelling is cruciaal.

Stamgebaseerde paradigmatiek speelt ook een belangrijke rol bij de bepalingvan de tussenklank in samenstellingen. De samenstellingen met rat als eerste lidin Tabel 6 illustreren het gebruik van de tussenklank -e(n)-. De rechterkolomvan Tabel 6 geeft voorbeelden van samenstellingen zonder tussenklank. Het Ne-derlands kent ook samenstellingen met -s- als tussenklank, zoals schaapskooi enschaapskleren. De keuze van de tussenklank varieert niet alleen per linker lid vande samenstelling, maar ook tussen samenstellingen die het linker lid gemeenschap-pelijk hebben, vergelijk schaapherder met schaapskooi en schapenwol.

Pogingen om de systematiek die aan de keuze van de tussenklank ten grond-slag ligt bloot te leggen met syntagmatische regels hebben gefaald. Echter, ineen paradigmatische benadering van de morfologie is de onderliggende systema-tiek verrassend simpel. Deze systematiek wordt bepaald door de distributie vande tussenklanken in de positionele subfamilies van de samenstelling. Hoe va-ker een tussenklank in de linker of rechter positionele familie voorkomt, des tewaarschijnlijker is het dat zij in nieuwe samenstellingen ingezet zal worden. Metbehulp van machineleertechnieken heeft Andrea Krott vast kunnen stellen dat dekansverdeling in de linker subfamilie belangrijker is dan de kansverdeling in derechter subfamilie.30

Met het aldus verkregen kwantitatieve model kunnen we precieze voorspel-lingen doen over het gebruik van de tussenklanken. Een nieuwe samenstelling alsrat krat vraagt zonder enige twijfel om -e(n)- als tussenklank, rattenkrat, wantalle andere samenstellingen met rat als eerste lid hebben ook -en- als tussenklank.Voor een samenstelling als schaap oog, zie Figuur 3, is de meest waarschijnlijkekeuze eveneens de -e(n)-. Dit is de tussenklank die het meeste voorkomt vol-gend op schaap. Maar hier zou eventueel ook de -s- gekozen kunnen worden,naar analogie van schaapskudde en schaapskooi. Het model van Andrea Krott doetgoede voorspellingen voor de tussenklanken die proefpersonen kiezen in nieuwesamenstellingen, en de tijd die zij nodig hebben om deze keuze te maken. Ookverklaart haar model waarom de meesten van u schapenkop beter vinden klinkendan schaapskaas. Door in schaapskop, de standaardvorm, de -s- te vervangen door-en- is de samenstelling regelmatiger geworden, en voelt zij grammatikaal aan.Maar vervangen we in schapenkaas de -en- door -s-, dan maken we de samenstel-ling onregelmatiger, en voelt zij contraintutief aan.31

Victor Kuperman is zijn promotieonderzoek begonnen met te laten zien datons model niet alleen de keuze van de tussenklank in samenstellingen voorspelt,

23

schaap oog

-s-schaapshond, schaapskleren,schaapskooi, schaapskop,schaapskudde, schaapsvacht

arendsoog, haviksoog,kennersoog, geestesoog,varkensoog

schaapherder

argusogen, pretogen,eksteroog, facetoog,gazelleoog, kraaloog,spleetoog, schelvisoog,slaapogen, vetoog

-en-

schapenbout, schapenvel,schapenkaas, schapengras,schapenkeutel, schapenteelt,schapenvacht, schapenwol

geitenoog, hondenoog,kattenoog, koeienoog,paardenoog

Figuur 3: Morfologische paradigmatiek ligt ten grondslag aan onze intutie dat-en- de beste keus is voor de tussenklank in de nieuwe samenstelling schaap-?-oog, en geen tussenklank () de slechtste keus. Machineleertechnieken hebbenuitgewezen dat het gewicht van de kansverdeling van de tussenklank in de linkerfamilie een stuk groter is dan de kansverdeling in de rechter familie.

maar ook de acoustische duur van de tussenklank. Hoe groter de kans op de -s-in de linker familie van de samenstelling, hoe langer de duur van de -s- is. Metandere woorden, hoe zekerder de spreker is over de keuze van de tussenklank, deste duidelijker wordt zij uitgesproken. De paradigmatiek van de tussenklankenwerkt blijkbaar door tot in de fijnste details van de articulatie.

Vergelijkbare paradigmatische processen spelen zich af bij de interpretatie vannieuwe samenstellingen. Ik heb er eerder op gewezen dat de betekenis van eensamenstelling als hotelrat onverwacht is gegeven de betekenissen van hotel en rat.Het is een traditionele wijsheid in de taalkunde dat samenstellingen gelede woor-den zijn waarvan de betekenis niet voorspelbaar is op grond van systematischeovereenkomsten in vorm en betekenis. Echter, de canadesche geleerde Christi-na Gagn heeft laten zien dat er veel meer van de betekenis voorspelbaar is dan

24

Tabel 7: De betekenisrelaties tussen het eerste en tweede lid in samenstellingenmet berg als eerste lid.

IN: berggeest, berggeit, berghut, bergjager, bergklimaat, bergkristal,berglucht, bergsport, bergstreek, bergstroom, bergwind, bergrivier,bergziekte, bergweide, bergpas, bergmeer, bergpad, bergkloof, berg-eend.32

DEEL VAN: bergwand, bergtop, berghelling.BESTAAND UIT: bergland, bergrug, bergmassief, bergketen, berg-kam, bergengte.VOOR GEBRUIK IN: bergstok, bergschoen.

altijd is gedacht.33 Zij begint met vast te stellen dat de betekenisrelaties die deleden van samenstellingen met elkaar aangaan, niet gelijkwaarschijnlijk zijn. Ta-bel 7 biedt een voorbeeld van de heel verschillende frequenties waarmee bete-kenisrelaties voorkomen in de samenstellingen die beginnen met berg. Bij hetmeerendeel van deze samenstellingen is er sprake van een relatie die het twee-de lid typeert als voorkomend in de bergen. Christina Gagn heeft laten ziendat de interpretatie van nieuwe samenstellingen gestuurd wordt door de kansver-deling van de betekenisrelaties in de linker familie van de samenstelling. Voorsamenstellingen die met berg beginnen, is een locatieve betekenisrelatie de meestwaarschijnlijke. Ik heb in deze rede al een aantal keren de samenstelling bergratgenoemd. Als u dit woord nog niet eerder was tegengekomen, dan denkt u waar-schijnlijk aan n of andere rattesoort die in de bergen voorkomt. Deze inter-pretatie wordt u aangereikt door de meest waarschijnlijke betekenisrelaties dieberg in andere samenstellingen aangaat. Zij is welhaast onontkoombaar. In ditvoorbeeld is deze interpretatie ook nog eens op het spoor van de conventionelebetekenis zoals Van Dale die geeft. Het gaat inderdaad om een knaagdier dat inde natuur in de bergen voorkomt, maar in de omgangstaal gebruiken we mar-mot.

Mijn laatste voorbeeld van het belang van de paradigmatiek betreft de on-zekerheid die u misschien wel eens is overvallen bij de verleden tijdsvormen vanwerkwoorden als dubben en krabben: is het nu DUBDE of DUPTE, KRABDE ofKRAPTE? Deze onzekerheid ontstaat omdat dubben en krabben uitzonderlijk zijnbinnen de verzamelingen woorden die een vergelijkbaar rijm hebben. Werkwoor-den als happen, trappen, prakken, klappen en lappen hebben allemaal een verleden

25

tijd die eindigt op -te: hapte, trapte, prakte, klapte, lapte. Het werkwoord krab-ben is uitzonderlijk omdat het, althans volgens de normen van de standaardtaal men denke aan de regel van t kofschip een verleden tijd heeft met -de inplaats van -te: krabde. Het paradigmatische netwerk waarin krabben ligt ingebedoefent druk uit op krabben om haar verleden tijd regelmatig te maken binnen hetparadigma, en leidt tot de intutieve welgevormdheid van krapte als nevenvormvan krabde. Mirjam Ernestus heeft in een lange reeks experimentele studies latenzien hoe deze paradigmatiek de lexicale verwerking benvloedt bij zowel nieuweals bestaande woorden.34

Paradigmatiek onder Occams mes

Gegeven dat paradigmatische verbanden ons inzicht in de taalsystematiek en inde lexicale verwerking wezenlijk verdiepen, rijst de vraag hoe die paradigmatieknu eigenlijk in zijn werk gaat. Stel dat we de verleden tijd willen vormen voorik rap, een klapperend geluid maken (Van Dale 1961, s.v.), niet te verwarrenmet het uit het Engels ontleende werkwoord rap (REP). Stel dat u nog nooitdeze verleden tijd hebt gebruikt. Moeten we ons dan voorstellen (zie Tabel 8)dat we beginnen met rap te vergelijken met al de in het geheugen opgeslagenwoorden waar het mee rijmt, vervolgens voor elk van die woorden kijken naarde corresponderende verleden tijd, dan met behulp van proportionele analogiebij al die verleden tijdsvormen de verleden tijd van rap afleiden, en tenslotte de

Tabel 8: De vorming van rapte met behulp van proportionele analogie van reedsin het lexicon aanwezige paren van tegenwoordige en verleden tijdsvormen in eenwoord en paradigma model. In dit voorbeeld is rapte de meest waarschijnlijkevorm, met een kans van 5 uit 6.

tap : tapte = rap : raptelap : lapte = rap : rapteflap : flapte = rap : rapteklap : klapte = rap : raptehap : hapte = rap : rapte

krap : krabde = rap : rabde

26

best ondersteunde van die verleden tijdsvormen uitkiezen? Deze voorstelling vanzaken, die aansluit bij de zogenaamde woord en paradigma morfologie,35 heeftvoor een verwerkingsmodel twee grote nadelen. In de eerste plaats is het aantalstappen dat nodig is om al die vergelijkingen te maken veel te groot om bio-logisch plausibel te zijn. In de tweede plaats kampt deze voorstelling van zakenmet een wel heel erg grote representationele redundantie. Het kan niet andersof hier moet Occams mes in. Ik heb betoogd dat gelede woorden geheugenspo-ren in het mentale lexicon achterlaten, maar dat hoeft nog niet te betekenen dathet lexicon bestaat uit eindeloze lijsten van woorden onder elkaar die bepaaldevormkenmerken gemeenschappelijk hebben, en algoritmen die deze lange lijstenmoeten langslopen.

Wat we nodig hebben is data-compressie. Een goede vorm van data-compres-sie verwijdert niet alleen redundantie, maar zorgt er ook voor dat belangrijke pa-radigmatische verbanden in het model met slechts enkele stappen toegankelijkworden. Van wat voor data-compressie zou het mentale lexicon gebruik kunnenmaken?

Om deze vraag te beantwoorden, is het nuttig om stil te staan bij hoe onsgeheugen op een hoger cognitief niveau werkt. Stelt u zich voor dat u bij dedeur van uw huis staat met een tas vol boodschappen, en dat u die in uw keu-ken wilt opbergen. Eerst moet de deur van slot en geopend, daarna moet u metuw boodschappen door de hal, recht vooruit nog een deur door, dan rechts envia de eetkamer de keuken in. Bij het volgen van dit pad door uw huis wordtu op elk moment ondersteund door uw geheugen. U herinnert u wat u zultzien als u de voordeur geopend hebt, de hal van uw huis. Elk van de deu-ren in de hal roept nieuwe herinneringen op aan de kamers achter deze deu-ren. Sommige kamers gebruikt u dagelijks, anderen zelden. Als u diep in ge-dachten uw huis binnenkomt, is het onwaarschijnlijk dat u op de automatischepiloot naar de zolder loopt. U komt dan vermoedelijk terecht waar u normaalaltijd naar toe gaat als u uw huis binnen komt, naar ik aanneem uw huiskamer.Wat belangrijk is in dit voorbeeld is dat u op heel veel verschillende manierendoor uw huis kunt lopen, dat er paden door uw huis zijn die u telkens weergebruikt, en dat u met een specifiek doel voor ogen, heel andere paden kunt vol-gen.

Laten we ons fonologisch geheugen eens voorstellen als een labyrint van ka-mers, en gangen die de kamers verbinden. De kamers staan voor de klanken vande taal, voor hun acoustische en articulatorische eigenschappen. De gangen, diemaar in n richting doorlopen kunnen worden, specificeren welke klankopeen-

27

volgingen mogelijk zijn. Dit labyrint van klanken representeert het geheugen voorde klankstructuur van de taal.

Laten we vervolgens ons morfologisch geheugen voorstellen als een verzame-ling kortere of langere sporen door het fonologisch labyrint.36 Deze sporen kun-nen op twee manieren gevolgd worden. Als u een woord hoort, krijgt u met elkenieuwe klank instructies voor welke gang u in het labyrint moet kiezen. Als ueen woord uit wilt spreken, volgt u de aanwijzingen van een spoor dat u in uwmorfologisch geheugen hebt opgeslagen.

Figuur 4 is een mini-grammatica voor de fonologie en morfologie van dewoorden die volgens de inzichten van de woord en paradigma"morfologie inTabel 8 volledig waren uitgespeld. Sporen in deze gerichte graaf lopen van linksnaar rechts. Het spoor voor tapte is met groen weergegeven, dat voor flap metrood, en dat voor krabde met blauw.

In Figuur 4 vindt u lange en korte varianten van de A en de P. Sinds hetberoemde proefschrift van Sieb Nooteboom in 1972 weten we dat de A in het

k

f

h

r

l

t

a

a

b

p

p

d

e

t

5

6

5

1 1

Figuur 4: Het fonologisch geheugen als een gerichte graaf, en het morfologischgeheugen als paden door deze graaf. Het pad voor tapte is in groen weergegeven,dat voor krabde in blauw, en dat voor flap in rood. De a en p representeren defonetisch langere verschijningsvormen van de a en p indien geen achtervoegselvolgt, de a, p en b representeren de fonetisch kortere vormen indien voorafgaandaan -te of -de.

28

tweelettergrepige tapte een kortere duur heeft dan de A in het nlettergrepige tap.Rachl Kemps heeft in haar proefschrift laten zien dat dit soort subtiele verschillenin de duur van de stam de interpretatie van gelede woorden sturen, lang voordatde achtervoegsels voor vervoegingen en verbuigingen het oor hebben bereikt.37

We nemen deze verschillen daarom in onze graaf op, hier voor het gemak metbehulp van twee discrete representaties, maar idealiter in de vorm van kansver-delingen over de acoustische en articulatorische details van deze klanken in hunfonetische context.38 Dankzij de specificatie van fonetisch detail in de graaf kun-nen we recht doen aan de observaties van Mark Pluymaekers en Mirjam Ernestusdat fonetisch detail mede bepaald wordt door de frequentie van het gelede woord.Ook kunnen we zo recht doen aan de positionele frequentie-effecten van HeidrunBien: de rat in zeerat, bergrat en kerkrat is een andere rat dan de rat in rattekop,rattehol en rattenplaag, woorden waarin rat gevolgd wordt door twee extra letter-grepen.

Met de graaf van Figuur 4 bereiken we aanzienlijke data-compressie. Zo vol-staan in deze graaf 14 punten, n voor elke klankvorm. In het model volgensde woord en paradigma theorie (Tabel 8), waarin elk woord geheel wordt uitge-speld, hebben we 54 klankrepresentaties nodig. We hebben met deze compressieoverigens niet alleen de redundantie tussen morfologisch verwante woorden zoalstap en tapte verwijderd, maar ook de redundantie tussen woorden als flap en lap.

Om recht te kunnen doen aan de paradigmatische verbanden tussen woordenhouden we in de graaf bij hoeveel woorden van de verbindingen gebruik maken.De verbinding van de lange a naar de lange p wordt door alle zes stammen vanTabel 8 gebruikt.39 De verbinding van de korte a naar de korte p wordt door vijfvan de zes verleden tijdsvormen gebruikt. De verbinding van de korte a naar de(korte) b daarentegen is uniek voor het spoor van krabde. Deze frequenties op delijnen die een punt van de graaf verlaten, kunnen we gebruiken om de macht dergewoonte in te schatten, om te kwantificeren welk spoor het meest waarschijnlijkis als we op onze automatische piloot zouden afgaan. Voor de groene en blauwesporen die vertrekken vanuit de a zijn deze kansen respectievelijk 5/6 en 1/6.De graaf voorspelt dat u, als u even niet oplet, KRAPTE zult zeggen in plaats vanKRABDE. En de graaf voorspelt ook dat als iemand KRAPTE tegen u zegt, het uniet eens opvalt dat u niet de standaardvorm hebt gehoord. Tenslotte voorspeltde graaf dat als u een nieuwe verledentijdsvorm moet maken voor rap, u zichlaat leiden door de macht der gewoonte en kiest voor RAPTE en niet voor RAB-DE. Op dezelfde manier kunnen we verklaren waarom schapekop een welgevormdalternatief is voor schaapskop.

29

Dit voorbeeld laat zien hoe een theorie met geheugensporen voor gelede woor-den in het mentale lexicon zowel zuinig kan zijn als ook in staat tot probabilisti-sche generalisaties over paradigmatische verbanden, en dit zonder eindeloze rijenanalogische verbanden te hoeven evalueren.

Deze theorie veroordeelt u overigens niet tot KRAPTE in plaats van KRAB-DE of tot SCHAPEKOP in plaats van SCHAAPSKOP, net zo min als u veroordeeldbent om altijd van uw voordeur naar uw huiskamer te lopen. Als u uw aandachterbij houdt, dan kunt u voorkomen dat u op het verkeerde spoor komt de zit-ten. U kunt de norm van de standaardtaal volgen, en kiezen voor KRABDE enSCHAAPSKOP. Naarmate u vertrouwder bent met de standaardvorm zult u beterin staat zijn de macht der fonologische gewoonte te overwinnen. Dit zien we bijeen verleden tijdsvorm als kruiste. Ondanks de voorkeur van het merendeel van deparadigmatisch verwante woorden voor -de, vergelijk sluisde, ruisde, huisde, pluis-de, kiezen we in het geval van kruis, zelfs als we niet opletten, in ongeveer 85% vande gevallen voor -te. Dankzij de hoge gebruiksfrequentie van kruis zijn we goedvertrouwd met het spoor van dit woord door het fonologisch geheugen, en kun-nen we fonologische attractors richting -de beter negeren en ons geheugenspoorvervolgen richting -te. De predicties van het fonologisch geheugen kunnen over-stemd worden door de specificaties over het te volgen spoor in het morfologischgeheugen.

Ook verkorte vormen zoals TUURLIJK, NTUUK en TUUK voor natuurlijkkrijgen in deze theorie een natuurlijke plaats, en wel als olifantenpaadjes doorhet lexicale labyrint. Welk van de vele alternatieve sporen u kiest voor natuur-lijk is niet alleen afhankelijk van stijl en formaliteit, maar ook, zoals Karen Keu-ne in haar promotie-onderzoek laat zien, afhankelijk van onder meer uw socialenetwerk. Zo is de kans op het gebruik van olifantenpaadjes voor woorden methet achtervoegsel -lijk groter in Nederland dan in Vlaanderen, en groter voormannen dan voor vrouwen.40 Elke spreker heeft zo haar eigen gespecialiseer-de mentale lexicon, met geheugensporen die gezamenlijk een talige vingerafdrukvormen. Kortom, het mentale lexicon is een dynamisch systeem dat voortdurendin verandering is, en waarin verschillende krachten op allerlei niveaus op elkaarinwerken.

Het onderzoek naar taal en het menselijk taalvermogen heeft in het verledenenorme impulsen gehad vanuit wiskundige disciplines zoals de theorie van forme-le talen en de formele logica. Ik ben ervan overtuigd dat het voor het hedendaagsetaalkundig onderzoek essentieel is om ook inzichten uit de kansrekening, de sta-tistiek en de machineleertechnieken in het hart van de theorievorming een plaats

30

te geven. Alleen zo zullen we in staat zijn om ten volle recht te doen aan de subtie-le probabilistische systematiek die zo kenmerkend blijkt te zijn voor de dynamiekvan woorden onder elkaar.

Aan het einde van deze rede gekomen, wil ik mijn dank uitspreken aan de Stich-ting Akademieleerstoelen Geesteswetenschappen van de Koninklijke NederlandseAkademie van Wetenschappen, die mij heeft willen voordragen voor de eervol-le benoeming op deze bijzondere leerstoel met als leeropdracht de kwantitatievetaalkunde. Deze dank geldt eveneens de Faculteit der Letteren en het College vanBestuur van de Radboud Universiteit Nijmegen. Ik zal mijn best doen het in mijgestelde vertrouwen niet te beschamen.

Ik maak van deze gelegenheid gebruik om ook NWO te bedanken voor hetPIONIER subsidie die ik mocht ontvangen voor mijn onderzoek naar de balansvan regels en opslag in het mentale lexicon. Zonder deze ondersteuning had ikhier vandaag niet gestaan.

Ook het Max Planck Instituut voor Psycholingustiek ben ik veel dank ver-schuldigd, zowel voor de prachtige tijd die ik er als staflid mocht doorbrengen, alsook voor alle ondersteuning in de daarop volgende jaren.

Dames en heren, ik heb ook heel veel te danken aan mijn naaste collegas. Iknoem er slechts enkelen bij name. Hooggeleerde Schreuder, ik geniet nog altijdvan onze nu al meer dan vijftien jaar bestaande samenwerking, een samenwerkingdie niet alleen heel vruchtbaar is gebleken, maar ook altijd buitengewoon plezierigis geweest. Het is mede dankzij uw hulp en inzet dat ik me in de psycholingustiekheb kunnen bekwamen.

Zeergeleerde Ernestus, onze samenwerking is nog maar een zestal jaren oud.In deze korte tijd hebt u zich niet alleen onmisbaar gemaakt als buitengewoongetalenteerd onderzoekster, maar ook als de organisatorische motor van onze on-derzoeksgroep. Ik hoop van harte dat wij ook in de komende jaren ons spannende,vruchtbare, en tegendraadse onderzoek op het grensvlak van fonologie en morfo-logie zullen kunnen voortzetten.

Hooggeleerde Boves, zeergeleerde Ten Bosch en Cranen, onze samenwerkingis nog maar enkele maanden oud. Ik heb hooggespannen verwachtingen en hoopveel van u te leren, met name over hoe simpele wellicht domweg simplistische taalkundige zoekontwerpen met bijvoorbeeld dynamic Bayesian networks han-den en voeten kunnen krijgen.

31

Vanzelfsprekend ben ik ook een woord van dank verschuldigd aan mijn pro-movendi voor de ontzettend plezierige samenwerking, voor hun creativiteit envoor hun wetenschappelijke toewijding. Hun namen heb ik in deze rede al ge-noemd, ik herhaal ze daarom hier niet.

Hard aan het lerende Benschop, Beukers, van der Knaap, Kertscher, Kruimel,Lahey, Mulder en Verhees, ik wil van deze gelegenheid gebruik maken om mijngrote erkentelijkheid voor jullie harde werk en inzet in ons quipe van student-assistenten in het openbaar uit te spreken.

Ik besluit met een dankwoord aan mijn ouders, en aan Tineke, Jorn, Corineen Thera voor hun steun voor en geduld met mijn fascinatie voor wetenschappe-lijk onderzoek, en natuurlijk voor nog heel veel meer.

Ik heb gezegd.

32

AANTEKENINGEN

1Kruyskamp (1961).

2Nieuwborg (1978).

3Bowers et al. (2005) hebben dit aangetoond met een semantische decisietaak. Re-cent onderzoek in samenwerking met Lee Wurm (Wayne State, Detroit) heeft ditresultaat gerepliceerd voor visuele lexicale decisie met behulp van entropiematengedefinieerd over de frequentieverdelingen van de verzamelingen ingebedde eninbeddende woorden.

4Pinker (1999), zie ook Pinker and Ullman (2002a) en Pinker and Ullman (2002b).

5Voor varianten van dit type model, zoals optimaliteitstheorien, geldt precies het-zelfde, zij het dat alle kennis wordt geabstraheerd in constraints in plaats van inherschrijfregels.

6Bod (1995); Daelemans et al. (1999); Daelemans and Van den Bosch (2005).

7Voor de rol van frequentie in het algemeen, zie Hasher and Zacks (1984), voorwoordfrequentie-effecten zie, e.g., Rubenstein and Pollack (1963); Oldfield andWingfield (1965); Whaley (1978).

8De frequenties zijn ontleend aan het CELEX lexicale gegevensbestand (Baayenet al., 1995), familieleden met frequentie 0 zijn niet in de tabel opgenomen.

9Schreuder and Baayen (1997).

10Zie De Jong et al. (2002) en ook Moscoso del Prado Martn et al. (2004).

11Zie Bertram et al. (2000); Baayen et al. (2002) voor frequentie-effecten bij lezenen Baayen et al. (2003) voor vergelijkbare effecten bij luisteren.

12Zie Bien et al. (2005).

13Zie Pluymaekers et al. (2005).

14Oostdijk (2002).

33

15Zie Ernestus et al. (2005).

16Zie, e.g., Booij (1995).

17Zipf (1949).

18Een controle-experiment waarin proefpersonen de op het beeldscherm getoondevorm alleen maar hoefden uit te spreken liet wel frequentie-effecten zien voor defrequentie van het werkwoord en de frequentie van de getoonde flectievorm, maarniet voor de frequentieverhouding.

19Zie bijvoorbeeld Bloch (1947) en Chomsky and Halle (1968).

20Zie ook Stemberger (2004).

21Zie Kim et al. (1991).

22Zie bijvoorbeeld Quirk et al. (1985).

23Baayen and Moscoso del Prado Martn (2005).

24Onregelmatige werkwoorden vertonen ook een voorkeur voor het hulpwerkwoordzijn in de voltooide tijden, en dus voor de teliciteit van de door het werkwoordaangeduide handeling. Zie Lieber and Baayen (1997) voor de relatie tussen dekeuze van het hulpwerkwoord voor de voltooide tijden en teliciteit.

25Zie, e.g., Jaeger et al. (1996); Ullman (2004).

26Zie Patterson et al. (2001); Lambon Ralph et al. (2005), maar voor het tegendeelTyler et al. (2004, 2005).

27Zie Marslen-Wilson and Tyler (1997, 1998) en Burzio (2002).

28Zie Rainer (1988) voor het belang van de relatieve frequenties bij alternatieve re-alisaties, en Dabrowska (2001, 2004) voor een voorbeeld van het volledig ontbre-ken van syntagmatische generalisaties buiten gebieden van paradigmatische con-vergentie in het complexe naamvalssysteem van het Pools.

29Bien et al. (2005).

30Zie, e.g., Krott et al. (2001) en Krott et al. (2005).

31Zie Krott et al. (2004)

32Van Dale meldt s.v. bergeend dat deze met name veel voorkomt in de duinen. Dit

34

is vermoedelijk een rationalisatie voor de benaming van deze eendensoort, eenrationalisatie die te verklaren valt door de grote paradigmatische ondersteuningvoor de locatieve interpretatie voor composita met berg als eerste lid.

33Zie, e.g., Gagn (2001).

34Zie, e.g., Ernestus and Baayen (2003, 2004b, 2005).

35Zie Blevins (2003) en Matthews (1974).

36Dit zoekontwerp voor een theorie voor het grensvlak van fonologie en morfologieis mede genspireerd door de geheugen en predictie theorie van Hawkins andBlakeslee (2004).

37Zie Nooteboom (1972) en voor de rol van subfonemisch detail, Salverda et al.(2003); Kemps et al. (2005a,b).

38Vergelijk ook Pierrehumbert (2001, 2002).

39Maar zie Ernestus and Baayen (2004a) voor de resten van stemhebbendheid in derealisatie van de p voor werkwoorden als krabben.

40Keune et al. (2005).

35

BIBLIOGRAFIE

Baayen, R. H., McQueen, J., Dijkstra, T., and Schreuder, R. (2003). Frequencyeffects in regular inflectional morphology: Revisiting Dutch plurals. In Baayen,R. H. and Schreuder, R., Morphological structure in language processing, 355390. Mouton de Gruyter, Berlin.

Baayen, R. H. and Moscoso del Prado Martn, F. (2005). Semantic density andpast-tense formation in three Germanic languages. Language, 81:666698.

Baayen, R. H., Piepenbrock, R., and Gulikers, L. (1995). The CELEX lexicaldatabase (CD-ROM). Linguistic Data Consortium, University of Pennsylvania,Philadelphia, PA.

Baayen, R. H., Schreuder, R., De Jong, N. H., and Krott, A. (2002). Dutchinflection: the rules that prove the exception. In Nooteboom, S., Weerman,F., and Wijnen, F., Storage and Computation in the Language Faculty, 6192.Kluwer Academic Publishers, Dordrecht.

Bertram, R., Schreuder, R., and Baayen, R. H. (2000). The balance of stora-ge and computation in morphological processing: the role of word formationtype, affixal homonymy, and productivity. Journal of Experimental Psychology:Learning, Memory, and Cognition, 26:419511.

Bien, H., Levelt, W.J.M., and Baayen, R. H. (2005). Frequency effects in com-pound production. Te verschijnen in PNAS, 102.

Blevins, J. P. (2003). Stems and paradigms. Language, 79:737767.

Bloch, B. (1947). English verb inflection. Language, 23:399418.

Bod, R. (1995). Enriching Linguistics with Statistics: Performance Models of Na-tural Language. University of Amsterdam: Institute for logic, language, andcomputation, Amsterdam.

Booij, G. E. (1995). The phonology of Dutch. Clarendon Press, Oxford.

Bowers, J., Davis, C., and Hanley, D. (2005). Automatic semantic activation ofembedded words: Is there a hat in that? Journal of Memory and Language,52:131143.

Burzio, L. (2002). Missing players: Phonology and the past-tense debate. Lingua,112:157199.

36

Chomsky, N. and Halle, M. (1968). The sound pattern of English. Harper andRow, New York.

Dabrowska, E. (2001). Learning a morphological system without a default: ThePolish genitive. Journal of child language, 28:545574.

Dabrowska, E. (2004). Rules or schemas? Evidence from Polish. Language andcognitive processes, 19:225271.

Daelemans, W. and Van den Bosch, A. (2005). Memory-based language processing.Cambridge University Press, Cambridge.

Daelemans, W., Van den Bosch, A., and Zavrel, J. (1999). Forgetting excepti-ons is harmful in language learning. Machine learning, Special issue on naturallanguage learning, 34:1141.

De Jong, N. H., Feldman, L. B., Schreuder, R., Pastizzo, M., and Baayen, R. H.(2002). The processing and representation of Dutch and English compounds:Peripheral morphological, and central orthographic effects. Brain and Langua-ge, 81:555567.

Ernestus, M. and Baayen, R. H. (2004a). The functionality of incomplete neu-tralization in Dutch. The case of past-tense formation. Te verschijnen in Labo-ratory Phonology, 8.

Ernestus, M. and Baayen, R. H. (2005). Paradigmatic effects in auditory wordrecognition: The case of alternating voice in Dutch. Te verschijnen in Languageand Cognitive Processes.

Ernestus, M. and Baayen, R. H. (2003). Predicting the unpredictable: Interpre-ting neutralized segments in Dutch. Language, 79:538.

Ernestus, M. and Baayen, R. H. (2004b). Analogical effects in regular past tenseproduction in Dutch. Linguistics, 42:873903.

Ernestus, M., Lahey, M., Verhees, F., and Baayen, R. H. (2005). Lexical frequencyand voice assimilation. In revisie voor JASA.

Gagn, C. (2001). Relation and lexical priming during the interpretation ofnoun-noun combinations. Journal of Experimental Psychology: Learning, Me-mory, and Cognition, 27:236254.

Hasher, L. and Zacks, R. T. (1984). Automatic processing of fundamental infor-mation. The case of frequency of occurrence. American Psychologist, 39:13721388.

Hawkins, J. and Blakeslee, S. (2004). On intelligence. Henry Holt and Company,New York.

37

Jaeger, J. J., Lockwood, A. H., Kemmerrer, D. L., Van Valin, R. D., and Murphy,B. W. (1996). A positron emission tomographic study of regular and irregularverb morphology in English. Language, 72:451497.

Kemps, R., Ernestus, M., Schreuder, R., and Baayen, R. H. (2005a). Prosodiccues for morphological complexity: The case of Dutch noun plurals. Memoryand Cognition, 33:430446.

Kemps, R., Wurm, L., Ernestus, M., Schreuder, R., and Baayen, R. H. (2005b).Prosodic cues for morphological complexity in Dutch and English. Languageand Cognitive Processes, 20:4373.

Keune, K., Ernestus, M., Van Hout, R., and Baayen, R. H. (2005). Social, geo-graphical, and register variation in Dutch: From written mogelijk to spokenmok. Corpus Linguistics and Linguistic Theory, 1:183223.

Kim, J., Pinker, S., Prince, A., and Prasada, S. (1991). Why no mere mortal hasever flown out to center field. Cognitive Science, 15:173218.

Krott, A., Baayen, R. H., and Schreuder, R. (2001). Analogy in morphology:modeling the choice of linking morphemes in Dutch. Linguistics, 39(1):5193.

Krott, A., Hagoort, P., and Baayen, R. H. (2004). Sublexical units and supralexi-cal combinatorics in the processing of interfixed Dutch compounds. Languageand Cognitive Processes, 19:453471.

Krott, A., Schreuder, R., Baayen, R. H., and Dressler, W. (2005). Analogicaleffects on linking elements in German compounds. Language and CognitiveProcesses, in press.

Kruyskamp, C. (1961). Van Dale Groot Woordenboek der Nederlandse Taal. Nij-hoff, Den Haag.

Lambon Ralph, M. A., Braber, N., McClelland, J. L., and Patterson, K. (2005).What underlies the neuropsychological pattern of irregular > regular past-tenseverb production? Te verschijnen in Brain and Language.

Lieber, R. and Baayen, R. H. (1997). A semantic principle for auxiliary selectionin Dutch. Natural Language and Linguistic Theory, 15:789845.

Marslen-Wilson, W. and Tyler, L. (1998). Rules, representations, and the Englishpast tense. Trends in cognitive sciences, 2:428435.

Marslen-Wilson, W. and Tyler, L. K. (1997). Dissociating types of mental com-putation. Nature, 387:592594.

38

Matthews, P. H. (1974). Morphology. An Introduction to the Theory of Word Struc-ture. Cambridge University Press, London.

Moscoso del Prado Martn, F., Kostic, A., and Baayen, R. H. (2004). Putting thebits together: An information theoretical perspective on morphological proces-sing. Cognition, 94:118.

Nieuwborg, E. R. (1978). Retrograde Woordenboek der Nederlandse Taal. Kluwer,Deventer.

Nooteboom, S. G. (1972). Production and perception of vowel duration: A study ofthe durational properties of vowels in Dutch. University of Utrecht, Utrecht.

Oldfield, R. C. and Wingfield, A. (1965). Response latencies in naming objects.Quarterly Journal of Experimental Psychology, 17:273281.

Oostdijk, N. (2002). The design of the Spoken Dutch Corpus. In Peters, P.,Collins, P., and Smith, A., New Frontiers of Corpus Research, 105112. Rodopi,Amsterdam.

Patterson, K., Lambon Ralph, M., Hodges, J., and McClelland, J. (2001). Defi-cits in irregular past-tense verb morphology associated with degraded semanticknowledge. Neuropsychologia, 39:709724.

Pierrehumbert, J. (2001). Exemplar dynamics: Word frequency, lenition andcontrast. In Bybee, J. and Hopper, P., Frequency and the emergence of lin-guistic structure, 137157. John Benjamins Publishing Company, Amster-dam/Philadelphia.

Pierrehumbert, J. (2002). Word-specific phonetics. In Gussenhoven, C. andWarner, N., Laboratory Phonology VII, 101140. Mouton de Gruyter, Berlin.

Pinker, S. (1999). Words and Rules: The Ingredients of Language. Weidenfeld andNicolson, London.

Pinker, S. and Ullman, M. (2002a). Combination and structure, not gradedness,is the issue. TRENDS in Cognitive Sciences, 6:472474.

Pinker, S. and Ullman, M. (2002b). The past and future of the past tense. Trendsin the Cognitive Sciences, 6(11):456462.

Pluymaekers, M., Ernestus, M., and Baayen, R. H. (2005). Lexical frequency andacoustic reduction in spoken Dutch. JASA, 118:25612569.

Quirk, R., Greenbaum, S., Leech, G., and Svartvik, J. (1985). A comprehensivegrammar of the English language. Longman, London.

Rainer, F. (1988). Towards a theory of blocking: the case of Italian and Germanquality nouns. In Booij, G. E. and Van Marle, J., Yearbook of Morphology I,155185. Foris, Dordrecht.

39

Rubenstein, H. and Pollack, I. (1963). Word predictability and intelligibility.Journal of Verbal Learning and Verbal Behavior, 2:147158.

Salverda, A., Dahan, D., and McQueen, J. (2003). The role of prosodic bounda-ries in the resolution of lexical embedding in speech comprehension. Cognition,9-0.5189.

Schreuder, R. and Baayen, R. H. (1997). How complex simplex words can be.Journal of Memory and Language, 37:118139.

Stemberger, J. P. (2004). Phonological priming and irregular past. Journal ofMemory and Language, 50:8295.

Tyler, L., Marslen-Wilson, W., and Stamatakis, E. (2005). Differentiating lexicalform, meaning, and structure in the neural language system. PNAS, 102:83758380.

Tyler, L., Stamatakis, E., Jones, R., Bright, P., Acres, K., and Marslen-Wilson, W.(2004). Deficits for semantics and the irregular past tense: A causal relations-hip? Journal of Cognitive Neuroscience, 16:11591172.

Ullman, M. (2004). Contributionss of memory circuits to language: the declara-tive/procedural model. Cognition, 92:231270.

Whaley, C. P. (1978). Word-nonword classification time. Journal of Verbal Lan-guage and Verbal Behavior, 17:143154.

Zipf, G. K. (1949). Human Behavior and the Principle of the Least Effort. AnIntroduction to Human Ecology. Hafner, New York.

40

TitelbladColofonIntroductieHet lexicon in de taalkundeGeheugensporen voor regelmatige gelede woordenGeheugen en (on)regelmaatGeheugensporen en paradigmatische verbandenParadigmatiek onder Occams mesDankwoordAantekeningenBibliografie

lexicon-het geheugen en predictie bij spreken verstaan en lezen

Documents