catma eine plattform zum kollaborativen und ...jstroetge/talks/dhd2016-catma-tutorial-catma... ·...
TRANSCRIPT
CATMA eine Plattform zum kollaborativen und automatisierten Annotieren und Analysieren von Texten
Thomas Bögel1, Evelyn Gius2, Marco Petris2, Jannik Strötgen3 1Universität Heidelberg, 2Universität Hamburg, 3MPI Saarbrücken
Workshop-Ablauf
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
2
¨ Hintergrund und Philosophie von CATMA ¨ (kurze) Einführung in computergestütztes Annotieren und Analysieren ¨ Hands-on! PAUSE ¨ Automatische Annotationen (heureCLÉA) ¨ noch mehr Hands-on ¨ Implementierung der Annotationen in CATMA
A N N O T A T I O N M I T
Unser Ausgangspunkt: ¨ philologische Textanalyse ¨ Funktion: Annotationen als …
¤ Anmerkungen ¤ Hervorhebung besonders relevanter Textstellen ¤ Markierung weiter zu analysierender Textstellen
à Annotation als wesentliches Mittel der philologischen Textanalyse
Textanalyse als (philologische) Praxis
3
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
CATMA (Computer Aided Textual Markup and Analysis)… ¨ ist eine Software für
Textauszeichnung und –analyse
¨ wurde für Nutzer/innen mit wenig technischer Vorerfahrung entwickelt
¨ basiert auf der Auffassung, dass ein Digital Humanities-Tool die methodologische und soziale Praxis traditioneller Philologie emulieren soll
à hermeneutischer Zugang zu Annotation
08.03.2016
4
CATMA (Bögel/Gius/Petris/Strötgen)
Textexploration & -annotation in CATMA
Workflow:¨ Tagsetserstellen&anno-eren¨ Fragenstellen¨ Ergebnisseinterpre-eren
¨ weiteranno-erenbzw.Tagsets/Annota-onenüberarbeiten
¨ (bessere)Fragenstellen¨ Ergebnisseinterpre-eren
¨ weiteranno-erenbzw.Tagsets/Annota-onenüberarbeiten
¨ ...
5
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
tagset = (wiederverwendbare) Sammlung von Tags tag = Konzept für Annotation (z.B. „Ort“, „Verb“, „Metapher“)
Anwendungsbsp.: Narrative Strukturen in Konflikterzählungen
¨ Verhältnis zwischen dem WIE und dem WAS in Konflikterzählungen ¨ Untersuchung narratologischer Kategorien ¨ bottom up: möglichst umfassende Analyse narratologischer
Phänomene ¤ 14 narratologische Felder mit über 400 narratologischen Konzepten
¨ Korpus: 39 faktuale Erzählungen über Arbeitssituationen
¤ … mit akuten Konflikten (18), ¤ … ohne Konflikte (15), und ¤ … mit gelösten Konflikte (6).
6
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
Anwendungsbsp.: Annotation und Analyse
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
7
¨ 23.904 Annotationen: ¤ 15.546 narratologische Tags ¤ 8.358 Hilfstags (Art der Erzählung, Sprecher/in etc.)
¨ plus: 4.147 zusätzliche Merkmale („properties“) der Tags ¨ Analyse der Distribution der narratologischen Phänomene
¤ für jedes narratologische Feld ¤ in Bezug auf die drei Erzählungstypen (akuter Konflikt, konfliktlos, gelöster Konflikt)
366 � Weitere Analyseergebnisse
Tab. A.11. Verhältnis von Wiedergabe von Rede und mentalen Prozessen in Erzähltripeln nachTextumfang
mentale Prozesse RedeK [K] -K ø K [K] -K ø
Brigitte A �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��Brigitte B �,�� �,�� - �,�� �,�� �,�� �,�� �,��Martin �,�� �,�� - �,�� �,�� �,�� �,�� �,��Milan �,�� �,�� - �,�� �,�� �,�� �,�� �,��Pascal �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��Tara �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��gesamt �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��
Tab. A.12. Vorkommnisse und relative Häu�gkeit von Wiedergabe von Rede und mentalenProzessen in den Haupterzählungen nach Einzelphänomenen
Vorkommnisse relative Häu�gkeitK [K] -K ges. K [K] -K gesamt
mental_process_representation ��� �� �� ��� ��� ���,� ���,� ���,�narrated_character_thought � � - � � �,� - ��,�transposed_character_thought ��� �� �� ��� ��� ��,� ��,� ���,�partly_quoted_character_thought � - � � � - ��,� ��,�quoted_character_thought �� � � �� �� ��,� ��,� ���,�narrated_character_speech ��� �� �� ��� ��� ���,� ���,� ���,�free_indirect_speech � - - � � - - �,�indirect_speech ��� �� � ��� ��� ���,� ��,� ���,�autonomous_direct_speech �� � � �� �� ��,� ��,� ��,�direct_speech ��� �� �� ��� ��� ���,� ���,� ���,�partly_quoted_speech �� � � �� �� ��,� ��,� ��,�alle Phänomene ���� ��� ��� ���� ���� ����,� ���,� ����,�
VerhältnisWiedergabevonRede/mentalenProzessen(rela>vzumUmfangderErzählung)(cf.Gius2015:366)
Anwendungsbsp: Ergebnisse
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
8
¨ 60+ Zusammenhänge zwischen narratologischen Phänomenen und Vorhandensein/Abwesenheit von Konflikten in der Erzählung è narrative Konstituierung von Konflikterzählungen
¨ meist in Form von ¤ “wenn Phänomen X vorhanden/abwesend/im Vergleich zu einem anderen Phänomen dominant ist,
handelt es sich um eine Erzähung über einen akuten Konflikt/einen gelösten Konflikt/keinen Konflikt.”
lowescala-on!"highescala-onfasternarra>on vs. slowernarra>on
itera>ve vs. repe>>vecomple>veanachronies vs. par>alanachronies
externalanalepses vs. internalanalepsesnarratedspeech vs. transposedspeech
speechrepresenta>on vs. representa>onofmentalprocessesfeelingsoftheotherparty vs. thoughtsoftheotherparty
morerepresenta>onsoftheaddressee
narrator’sspeechandmentalprocessesmorenarrators(andnarra>velevels)highinvolvementinac>onofnarratorpassagewithpresencefunc>onsdis>nctphenomenaofperspec>ve
Literaturwissenschaftliche Textanalyse mit CATMA
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
9
I. Erkenntnisinteresse
II. Forschungsfrage formulieren
III. Konkreten Textbezug sichern „An welchem Textphänomen X kann
man die Fragestellung untersuchen?“
Qualitative Dimension - Aspekt der Bedeutung
„Was bedeutet X, und zwar à textintern à textüberschreitend?“
Quantitative Dimension - Aspekt der Verteilung
„Wo kommt X vor, und zwar. à textintern à textüberschreitend?“
Pragmatische Dimension – Komplexität
„Ist X ein einfaches oder ein zusammengesetztes Phänomen?“
A. Inhaltliche Reflexion: „Worum geht‘s?“
B. Heuristische Reflexion: „Wie könnte man‘s herausbekommen?“
C. Praktische Reflexion: „Wie kann man Verteilung / Bedeutung mit CATMA analysieren ?“
IV. Operationalisierung in CATMA
1. Suchen & Finden
2. Markieren
3. Fragen & Auswerten
4. Interpretieren
D. Kritische Reflexion: „Wie brauchbar sind die Ergebnisse?“
Hands-on: Erste Schritte in CATMA
¨ Login: www.digitalhumanities.it/catma/
¨ weitere Infos: ¤ www.catma.de ¤ www.digitalhumanities.it/catma/manual/
10
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
The Developer‘s Perspective
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
11
¨ CATMA‘s approach to annotation
Paper Annotation
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
12
Annotation paper style • the annotation is embedded in the
annotated text, either • inline („interlinear“) • in the page margins • in a different layout section of the
text (footnotes, apparatus etc.) that is cross-referenced using a scheme, such as footnote / end note numbering)
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
13
Corpus
Markup file Markup file
Markup file Markup file Markup generated by users 1, 2 ... n
User Markup
Text document
Tag Type Libraries
Markup Collections
Collections of tags (= annotation terms). These can be pre-defined & imported, and/or extended and defined ‚on the fly‘ during the annotation process
CATMA file types
Inanagitatedmood,hehastenedthroughthestreetsofthecity.Withoutthegate,hesatdownbeneaththetrees.Shehadtoldhiminthemorningthatshewastogothatnight,withsomerela>ons,tothecountry.Intoxicatedwithlove,herose,hesat,hewanderedinthewood[…].
1
0-5657-116117-173174-236237-
1Excerptfrom„DerPokal“,LudwigTiek1812,Transla>onThomasCarlyle„TheGoblet“,Wikisource
Analepsisofpar$alextent(coversonlypartofthe‘backstory’)andinternalreach(itdoesn’textendintothe‘pre-history’ofthemainstoryline).
Example1:annota>ngananalepsis
14
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
Shehadtoldhiminthemorningthatshewastogothat
night,withsomerela>ons,tothecountry.
117-173
174-217
Ananalepsisofpar>alextentandinternalreach
15
TagType• „Analepsis“• n• AuthorType
„Shehad[…]thecountry.“ TagInstance
TagInstanceReference
defines
oneormore
annotatesrangesoftext
Step 1: Define Tag Type, Instance & Range
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
TagType• „Analepsis“• n• AuthorType
Analepsisofpar>alextentandinternalreach.
„Shehad[…]thecountry.“ TagInstance
TagInstanceReference
Propertydefini>ons• extent(complete,par>al,...)• reach(internal,external,...)
Proper>es• extent–par>al• reach–internal• AuthorInstance
CATMA (Bögel/Gius/Petris/Strötgen)
16
defines
oneormore
instancespecificconfigura>on
par>allypredefined
annotatesrangesoftext
has
Step 2: Define Tag instance specific properties
08.03.2016
1Excerptfrom„DerPokal“,LudwigTiek1812,Transla>onThomasCarlyle„TheGoblet“,Wikisource
Archaictransla>on,amorecontemporarytransla>oncouldbe„outside“.
Example2:annota>ngahistoricwordform
CATMA (Bögel/Gius/Petris/Strötgen)
17
Inanagitatedmood,hehastenedthroughthestreetsofthecity.Withoutthegate,hesatdownbeneaththetrees.Shehadtoldhiminthemorningthatshewastogothatnight,withsomerela>ons,tothecountry.Intoxicatedwithlove,herose,hesat,hewanderedinthewood[…].
1
0-5657-116117-173174-236237-
08.03.2016
Withoutthegate,hesatdownbeneaththetrees.57-105
Archaictransla>on,amorecontemporarytransla>oncouldbe„outside“. TagType
• „ArchaicTransla>on“
• n
Propertydefini>on• contemporary(?)
TagInstance
Property• contemporary–outside
DefiningTagtype,taginstance&taginstanceproper>es
CATMA (Bögel/Gius/Petris/Strötgen)
18
instance specific configuration with adhoc value
partially predefined
has
08.03.2016
TagType• treestructure
TextRangeTagInstance
TagInstanceReference
Propertydefini>ons• name• (possiblevalues)
Proper>es• name–value
reusable,textindependent
CATMA’sannota>onmodel
19
defines
instancespecificconfigura>on
par>allypredefined
has
oneormoreannotates
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)