signaling coherence relations in text generation a case study of german temporal discourse markers...
TRANSCRIPT
Signaling coherence relations in text generation
A case study of German temporal discourse markers
Brigitte Grote
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Motivation (1)
1. Warten bis der Motor kalt ist, dann den Kühlerdeckel im Gegenuhr-zeigersinn bis zum Anschlag drehen. BEIM DREHEN DEN DECKEL NICHT NIEDERDRÜCKEN. Nachdem der Druck abgelassen ist, den Deckel durch Niederdrücken und Drehen im Gegenuhrzeiger-sinn abnehmen. Kühlmittel nachfüllen bis der Kühler voll ist, dann den Deckel wieder aufschrauben. Fest andrehen. Den Reservetank bis zur oberen Pegellinie “MAX” bei kaltem Motor auffüllen.
2. a. {Nachdem | Sobald} der Druck abgelassen ist, den Deckel abnehmen.b. Den Druck ablassen, bevor Sie den Deckel abnehmen.c. Den Druck ablassen. Dann den Deckel abnehmen.
3. Ich schaue morgen vorbei, {obwohl | obzwar | wenn (ich) auch | und das, obwohl} ich eigentlich keine Zeit habe.
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Motivation (2) Diskursmarker:
lexikalische Einheiten, welche die Art der semantischen/ rhetorischen Beziehung zwischen benachbarten Textsegmenten auf der sprachlichen Oberfläche anzeigen
Beschreibung der Form und Funktion von Diskursmarkern
Textgenerierung:
genaue und richtige Auswahl der Diskursmarker
SEQUENCE
PURPOSE
Kühlmittel nachfüllen
Tank voll
Deckel aufschraube
n
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Stand der Forschung (1)Repräsentation und Wahl von Diskursmarkern
1:1 Abbildung Kohärenzrelation - Diskursmarker Diskursmarkerwahl als “Nebeneffekt” anderer
Entscheidungen der Satzplanung (Reiter/Dale 2000) isolierte Einzelstudien
kleine Menge an Markern kausale (z.B. Delin et al. 1996), konzessive (z.B. Scott 1999),
temporale (z.B. Dorr/Gaasterland 1995), … ad hoc Studien Englisch
bisher nur unzureichende Lösungen für korrekte Auswahl keine linguistisch fundierte Ressource für Wissen um
Gebrauch von Diskursmarkern
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Stand der Forschung (2)
Studien zu Form und Funktion von Diskursmarkern Genauigkeit (z.B. König 1991 (konzessiv), Sinn 1991 (temporal) vs. Abdeckung (z.B. Knott 1996, Martin 1992, Pasch et al. 2003) Fokus auf syntaktischen und semantischen Eigenschaften Ausnahme: Halliday/Hasan 1976, Martin 1992: Funktionale
Beschreibung, Conjunctive Relations
Temporale Diskursmarker des Deutschen einzelne Diskursmarker (z.B. während, Clement/Thümmel 1996) Lexika (Pasch et al. 2003, Schröder 1990) semantische Studien (Steube 1980, Herweg 1990, Bäuerle 1995)
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Ziele der Arbeit linguistisch-deskriptiv
Beschreibung der Funktion deutscher kohärenzstiftender Ausdrücke mit temporaler Bedeutung theoretischer Rahmen: Conjunctive Relations (Martin 1992)
Modellierung der Diskursebene computerlinguistisch
Ressource für Wissen über Funktion und Gebrauch von Diskurs-markern
Modell für die Diskursmarkerwahl in der Text-generierung Untersuchungsgegenstand
temporale Diskursmarker Deutsch; Englisch nur ansatzweise technische Instruktionen: geschriebener, monologischer Text
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
VorgehenSieben Schritte:
1. Identifikation der Diskursmarker in deutschen (und englischen) technischen Instruktionen
2. Bestimmung der Dimensionen der Diskursmarker-beschreibung
3. detaillierte Analyse einer Gruppe von Diskursmarkern4. funktionale Beschreibung der Diskursmarker5. Modellierung der Repräsentationsebene, auf der
Diskurs-markerwahl operiert6. uniforme Beschreibungsebene von Diskursmarkern
für MLG7. prototypische Architektur für Diskursmarkerwahl in
MLG
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Schritt 1: Menge der Diskursmarker
Ziel: Identifikation der Lexeme im Text, die als Diskursmarker fungieren Definition der Klasse der Diskursmarker
Wortklasse Temporale Diskursmarker
Präposition ab, bei, bis, mit, nach, seit, vor, während
subordinierendeKonjunktion
als, bevor, bis, ehe, kaum dass, nachdem, seitdem, sobald, solange, sooft, sowie, während, wenn
Konjunktive danach, dann, daraufhin, davor, währenddessen, zuvor
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Schritt 2: Dimensionen temporaler Diskursmarker
Ziel: Bestimmung der Eigenschaften, welche für die Beschreibung temporaler Diskurs-marker relevant sind
Quellen:
Forschungsliteratur Betrachtung temporaler Marker in Korpora Substitution test (Knott, Mellish 1996)
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Beschreibungs-dimension
Werte
Temporale Relation
temporale Relationen (Allen 1984)prox, imm, next, dur (nach Herweg 1990)
Intentionen inform, convince (Hovy 1988)
Präsuppositionen presupposed, not-presupposed (Lascarides, Asher 1993)
Situationstyp state, activity, event (Sinn 1991, Stede 1999)
Aktionsart stative, semelfactive, durative, transformative, resultative, causative, iterative (Bußmann 1990)
Aspekt imperfective, perfective
Verbzeit Basic Tense Structure Konstellation E,R, S (Reichenbach 1947)
Abfolge der Relata postponed, topicalised, verb-first,preposed (Schilder 1997)
Position des DM Vorfeld, Mittelfeld, Vorvorfeld (Eisenberg 1994)
Wortklasse PP, Pronominaladverb, koord. Konj., subord. Konj., Präp.
Temporale Quantifier
modifizierbar, nicht modifizierbar (Quirk et al. 1972)
Stil formal, archaisch, knapp, neutral
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Schritt 3: Analyse temporaler Diskursmarker
Ziel: umfassende Beschreibung von Bedeutung und Verwendung deutscher temporaler Diskursmarker
27 temporale Marker (Schritt 1) werden entlang der Dimensionen (Schritt 2) beschrieben
Analyse neutral bzgl. der linguistischen Theorie keine Neuanalyse sondern Integration der
Ergebnisse der zahlreichen Einzelstudien
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Beispiel “nachdem”Zwei Lesarten von nachdem (Herweg 1991)
Precedence: (6a) Nachdem Peter sich in seinen Sessel gesetzt hatte, griff er nach der Zeitung.
Overlap: (6b) Nachdem Peter in seinem Sessel saß, griff er nach der Zeitung.:
nachdem (precedence)
Temporal relation
after(Sitm,Sits) and prox(Sitm,Sits), or meets(Sitm,Sits)
Conditions of use
Sits is presupposedSits is r-bounded or lr-bounded (egressive)Sitm is l-bounded or lr-bounded (ingressive)clause denoting Sits has a perfective aspectclause denoting Sitm has an imperfective aspecttense sequence; E(Sits)<E(Sitm) where E(Sits)<=Shypotactic clause complex, subord. conjunction
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
nachdem(overlap)
preferred ordering is preposeddiscourse marker takes front position and can be modifiedclause denoting Sits is positive and not hypothetical
Temporal relation
finishes(Sitm,Sits) or overlaps(Sitm,Sits) or during(Sitm,Sits)in terms of precedence: after(Sitm,ingr(Sits)) and prox(Sitm,ingr(Sits)), or meets(Sitm,ingr(Sits))
Conditionsof use
Sits is presupposedSits is l-bounded or lr-bounded (ingressive)verb denoting Sits is stative/resultativeclause denoting Sitm has an imperfective aspectsame tense; E(Sits)=E(Sitm) where E(Sits)<=S and E(Sitm)<=Shypotactic clause complex, subord. Conjunctionpreferred ordering is preposeddiscourse marker takes front position and can be modifiedclause denoting Sits is positive and not hypothetical
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Schritt 4: Funktionale Beschreibung
Ziel: funktionale Klassifikation der analysierten temporalen Diskursmarker im Sinne von Martin (1992)
Repräsentation in Netzwerken:temporal conjunctive relation networks für das Deutsche
Diskursmarker als eine Realisierungsmöglichkeit Repräsentation der Gemeinsamkeiten und
Unterschiede zwischen Diskursmarkern Aussagen zu Kriterien für die Wahl Hyponymie-Relationen zwischen Diskursmarkern
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Deutsche temporale „anterior conjunctive relations“
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Computerlinguistische Anwendung
Einsatz der linguistischen Beschreibung in der automatischen Textgenerierung erfordert
Spezifikation der Repräsentationsebene, auf der Diskursmarkerwahl-Prozeduren operieren Diskursebene (Schritt 5)
generische Ressource für das Wissen um Bedeutung und Gebrauch von Diskursmarkern Diskursmarkerlexikon (Schritt 6)
Architektur für die Auswahl konkreter Kohärenzausdrücke in der automatischen Textgenerierung Auswahlprozedur (Schritt 7)
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Schritt 6: Entwicklung des Diskursmarkerlexikons
Ziel: Entwicklung einer allgemeinen Ressource zur Spezifikation von Wissen um Bedeutung und Gebrauch von Diskursmarkern
Diskursmarkerwahl als lexikalische Entscheidung Repräsentation des lexikalischen Wissen im Lexikon
lexikalisches Wissen ungleich syntaktisches Wissen Beeinflussung syntaktischer Entscheidungen durch
lexikalische Information Textgenerierung: Diskursmarkerwahl interagiert mit
anderen Satzplanungsentscheidungen uniforme Repräsentation und allgemeine Verfügbarkeit
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Organisation des Lexikons
Definition Lexikon als Verzeichnis der Wörter einer Sprache,
hier der funktional motivierten Klasse der Diskursmarker
Zwei Ebenen der Beschreibung (in Anlehnung an EAGLES 1999)
flat layer: einzelne Lexikoneinträge structuring layer: Beziehungen zwischen
Lexikoneinträgen (lexiko-semantische Beziehungen, Vererbungshierarchien)
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Definition “Diskursmarker” (1)discourse-marker-entry
[-ORTHOGRAPHY: string-WORD-SENSE-ID: word-sense-ID-LANGUAGE: (German | English)EXAMPLE: string-SEMANTIC-RELATION: ideational-relation*-INTENTION: interpersonal-relation*-NUCLEARITY: (S0-nucleus | S1-nucleus | multinuclear)-PRESUPPOSITION: (presupposed | not-presupposed)-STATUS: (internal | external)PART-OF-SPEECH: (conj | pronadv | coordc | subc | prep)ORDERING: ordering-type*POSITION: position-type*MODIFICATION: (modifiable | not-modifiable)POLARITY: (positive | negative)HYPOTHETICAL: (realized | unrealized)-STYLE: stylistic-preferences*SYNONYMS: word-sense-id*ANTONYMS: word-sense-id*HYPONYMS: word-sense-id*]
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Definition “Diskursmarker” (2)ideational-relation (occasion | expansion)occasion [IDEATION: ideation-type
POLARITY: (positive | negative) MODALIZATION: (realis | irrealis) MODALITY: (certain | possible)]
ideation-type (additive | temporal | causal)temporal (preceding | co-occuring)
preceding (before | meets)co-occuring (equals|starts|finishes|overlaps|during)
position-type (initial | front | middle | end)
stylistic-preferences ->[FORMALITY: (highfalutin | neutral | colloquial) USAGE: (neutral | archaic | rare) BREVITY: (concise | non-consice)]
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Definition “temporale Diskursmarker” temporal-marker-entry
[DISCOURSE-MARKER-INFO: discourse-marker-entry-SEMANTIC-RELATION: temporal-information-BOUNDEDNESS-SIT-M: boundedness-type*-BOUNDEDNESS-SIT-S: boundedness-type*-SITUATION-TYPE: situation-type*-AKTIONSART-MC: aktionsart-type*-AKTIONSART-MC: aktionsart-type*-ASPECT-MC: aspectual-type*-ASPECT-SC: aspectual-type*TENSE: tense-information*]
temporal-information [-TEMPORAL-RELATION: temporalCONSTRAINTS: proximity*EXTENSION: (dur | not-dur)]
proximity (prox | next |imm | same-place)
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Zusammenfassung Motivation
Probleme bei Diskursmarkerwahl in der Textgenerierung fehlende linguistische Beschreibungen
Diskursmarkeranalyse und – repräsentation Dimensionen der Beschreibung Analyse temporaler Diskursmarker funktionale Repräsentation
Diskursmarkerlexikon Struktur des Lexikons Definition eines allgemeinen Lexikoneintrags Generierungslexikon und Beispieleinträge
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Beitrag der Arbeit (1) Definition der Klasse der Diskursmarker
Test zur Identifikation deutscher Diskursmarker Beschreibung temporaler Diskursmarker
Bestimmung der relevanten Beschreibungsdimensionen detaillierte Analyse deutscher temporaler Diskursmarker Integration vorhandener Einzelstudien
funktionale Klassifikation Netzwerk deutscher temporaler Conjunctive Relations Vorarbeiten zu multilingualer Ressource
Kohärenzrelationen allgemeine Strategie zur Bestimmung genre-spezifischer
Kohärenzrelationen paradigmatische Beschreibung für den Texttyp
12. Januar 2004Kolloquiumsvortrag Brigitte
Grote
Beitrag der Arbeit (2) Diskursmarkerlexikon
Systematisierung der Beschreibungen einzelner Diskursmarker einheitliche Repräsentation im Diskursmarkerlexikon
Definition der Lexikoneinträge entlang der EAGLES-Richtlinien
Strategie zur Herleitung von Lexikoneinträgen Spezifikation von temporalen Lexikoneinträgen
Automatische Diskursmarkerwahl Bereitstellung der Ressourcen Beschreibung der Auswahlprozedur
Natural Language Processing deklaratives Diskursmarkerlexikon