metaphor mining in historical german novels: using unsupervised learning to uncover conceptual...
TRANSCRIPT
DH2016 Krakow , July 14th 2016
METAPHOR MINING IN HISTORICAL GERMAN NOVELS:
USING UNSUPERVISED LEARNING TO UNCOVER CONCEPTUAL SYSTEMS IN LITERATURE.
STEFAN PERNES UNIVERSITY OF WÜRZBURG
‣ a systematic mapping, or rather, the projection of one domain (e.g. light) onto another (e.g. beauty)
‣ a (usually abstract) concept can be experienced through another (usually concrete) concept
DEFINITIONS
Der Mensch ist ein Wolf.
Die Tante meckert.
Es ist strahlend schön.
‣ linguistic metaphor
Man is a wolf.The aunt bleats (complains).It is radiantly beautiful.
‣ conceptual metaphor
DEFINITIONS
Wie geht’s?
Es läuft gut.
Es geht voran.
LIFE IS A JOURNEY ARGUMENT IS WARDas Argument ist vernichtend.
Die Theorie hält stand.
Die Kritik trifft gezielt.
‣ a cognitive ‘bracket’ that encompasses all possible specific realisations ‣ a cognitive phenomenon that expresses itself in language
It’s going well. The theory withstands.
DEFINITIONS
lexicalized novel
‣ conventionality
“Tischbein” “Spaß machen”
conventional
“spitze Bemerkung” “strahlend sauber”
“Schwarze Milch der Frühe”
“table leg” “black milk of the morning”“making fun”
“sharp comment”“shiningly (spotlessly) clean”
‣ noun metaphor
‣ copula-construction (“ist”, “wie”, “als”) “Peter ist ein schräger Vogel.”
‣ genitive metaphor “der Strom des Lebens”
‣ compound metaphor “Geistesblitz”
FEATURES
“the stream of life”
“Peter is an awkward bird (a crazy guy)”
“flash of inspiration”
‣ verb metaphor:
‣ adjective metaphor:
FEATURES
“die Ideen sprudelten”
“ein strahlender Tag”
overview on metaphor constructions in German, cf. Skirl & Schwarz-Friesel 2007
“ideas gush”
“a radiant (bright) day”
‣ preposition metaphor “in Gedanken versunken”
“deep in thought”
PREPROCESSING
‣ process corpus with POS-tagging and dependency parsing
‣ extract metaphor candidate constructions
‣ build similarity matrix using a distance/divergence measure (here: Jensen-Shannon divergence)
EVALUATION
"HGFC operates with a precision of P = 0.69, whereas the baselines
attain P = 0.36 (AGG) and P = 0.29 (WN). The precision of annotator
judgements against each other (the human ceiling) is P = 0.80,
suggesting that this is a challenging task."
Shutova & Sun 2013
➡ a manually annotated metaphor corpus for German is in the works
‣ a combination of texts from TextGrid's digital library and from the Gutenberg project
‣ 1418 works
‣ 116,423,486 tokens
DATASET
CLUSTERING RESULTS
feuer-wehmut source: feuer targets: wehmut verzweiflung kummer jahrhundert erregung features: brennen herd kamin werfen-prep groß anzünden sitzen-prep geben setzen-prep sehen lager gehen-prep klein schüren stehen-prep schlagen fangen lauf hell heilig lodern löschen gewehr zünden sehen-prep legen-prep freuden erlöschen kohlen entzünden legen nehmen-prep kommen-prep kommen lodernd anmachen werfen sein-prep flackern sprühen leuchten höllisch bringen-prep flammen werden-prep wild speien ausbrechen liegen-prep höllen
fire-despair
CLUSTERING RESULTS
organismus-nation source: organismus targets: nation kunst kreuz bibel verkehr features: ganz menschlich staats gesamt eigen gesund lebend hoch groß welt lebendig klein zerstören zart weiblich tierisch erschüttern elterlich übrig wunderbar stehen neu natürlich müssen krank geben staat sein-prep scheinen schaffen niedrig liegen-prep kräftig jung größern finden familie besitzen wirkung-prep vorgang-prep volks vertragen versuch-prep stören schön schwächen psychisch physisch nieder nennen
organism-nation
CLUSTERING RESULTS
ferne-klarheit source: ferne target: klarheit ferne lampe appetit hett features: weit sehen-prep hören-prep liegen-prep blicken-prep kommen-prep klingen-prep blau schauen-prep verlieren-prep ziehen-prep stehen-prep rücken-prep tönen-prep vernehmen-prep rufen-prep erblicken-prep unendlich verschwinden-prep zeigen-prep blick-prep schweifen-prep richten-prep groß welt betrachten-prep scheinen-prep tauchen-prep beobachten-prep erkennen-prep unbekannt starren-prep sein-prep gehen-prep erscheinen-prep dringen-prep suchen-prep schimmern-prep ertönen-prep halten-prep verhallen-prep haben-prep erheben-prep rollen-prep folgen-prep erschallen-prep unbestimmt leuchten-prep bemerken-prep antworten-prep
distance-clarity
CLUSTERING RESULTS
drohung-ton source: drohung targets: ton gespenst bemühung erscheinung stirne features: ausführen leer ausstoßen wild zwingen-prep furchtbar schrecklich klingen nehmen hören versteckt stoßen fürchterlich lachen-prep gehen-prep bringen verwirklichen letzt erfüllen sprechen sein-prep scheinen hart einschüchtern-prep liegen heftig enthalten dunkel bewegen-prep aussprechen schrecken antworten-prep vater hinreißen-prep helfen gelten führen erschrecken-prep ernst ergehen-prep bringen-prep wütend wirken werfen verlassen-prep unverständlich setzen-prep schwer sagen-prep mann
threat-tone
CLUSTERING RESULTS
segen-kindheit source: segen targets: kindheit ausgang sonntag jungfer winter features: geben bringen sprechen empfangen gott abend erteilen kinder bitten-prep ruhen groß himmel reich gut vater letzt väterlich haus priester nehmen ernte spenden wahr eltern herr gottes erflehen bleiben verwandeln-prep liegen kommen wünschen recht mutter erbitten voll rufen morgen gereichen-prep gehen ganz fehlen verbreiten tragen kirche wetter sprechen-prep mütterlich erhalten arbeit
blessing-childhood
THANK YOU!
• Shutova, E. and Sun, L., 2013, June. Unsupervised Metaphor Identification Using Hierarchical Graph Factorization Clustering. In HLT-NAACL (pp. 978-988).
• Skirl, Helge, and Monika Schwarz-Friesel. 2007. Metapher. Universitätsverlag Winter.
• Yu, K., Yu, S. and Tresp, V., 2005. Soft clustering on graphs. In Advances in neural information processing systems (pp. 1553-1560).
References