extracting opinion targets in a single- and cross-domain ... · 1 extracting opinion targets in a...

Extracting Opinion Targets in aSingle- and Cross-Domain SettingWith Conditional Random Fields

Niklas Jakob and Iryna Gurevych, 2010

Matteo Bonaker, 2017Selected Topics in Sentiment AnalysisDr. Michael Wiegand

Folien / PräsentationVeranstaltung

Dozent

Kontext

‣ 2010 veröffentlicht

‣ Damals existierende Forschung:

‒ Sentiment-Analysis auf Cross-Domain

‒ CRF für Sentiment-Analysis

‒ Opinion-Target-Extraction auf Single-Domain

‣ Neue Kombination:

‒ Opinion-Target-Extraction auf Cross-Domain (mit CRF)

‣ CRF ist ein Machine-Learning-Modell

‣ Ähnlich wie HMMs

‣ Eingabe-Format unterschiedlich:

Bernie

Theorie Anwendung Cross-Dom.

‣ CRF ist ein Machine-Learning-Modell

‣ Ähnlich wie HMMs

‣ Eingabe-Format unterschiedlich:

Bernie

Ausgabe

‣ Ausgabe des CRF: Block-Markierung

‣ „Auflösung“ des Opinion-Target wird nicht gemacht

Bernie

Ausgabe (IOB)

‣ Beginning …

‣ Inside … … of Opinion Target

‣Outside …

‣Markierung angrenzender Blöcke möglich

Einfaches Beispiel: I like trains. O O B O

Beispiel:

Even though I like cottage cheese veganism is more important to me. O O O O B I B O O O O O O

Eingabe

‣ Token

‣ POS

‣ Short Dependency Path

‣ Word Distance

‣ Opinion Sentence

Eingabe

‣ Token

‒ Wort / Satzzeichen

‒ Lernbar: „crew“ häufiger Target, als „admire“admire

camera

Gladiator

admire

camera

Gladiator

Eingabe

‣ Token

‣ POS

‒ Lernbar: NN häufiger Target, als VBRVBR

admire

camera

Gladiator

Eingabe

‣ Token

‣ POS

‣ Word Distance

‒ Zu jeder Opinion-Expression:NP mit kürzester Distanz

‒ Lernbar: Target häufig in nahegelegener NP

admire

camera

Gladiator

Eingabe

‣ Token

‣ POS

‣ Word Distance

‣ Opinion Sentence

‒ Wenn eine Opinion-Expression da ist,alle Token des Satzes markieren!

‒ Lernbar: Sätze ohne Opinion ignorieren

admire

camera

Gladiator

Eingabe

‣ Token

‣ POS

‣Word Distance

‣Opinion Sentence

Cross-Domain

‣ Warum sollte Cross-Domain schwieriger sein?

‒ Domain-Spezifisches „Wissen“ des CRF!

‣ Hier nochmal die Features:

‒ Token

‒ POS

‒ Short Dependency Path

‒ Word Distance

‒ Opinion Sentence

Vorgehen

‣ Token-Feature für Cross-Domain entfernt

‣ Training auf 3 oder weniger Domains

‣ Test auf einer der übrigen Domains

Schlussfolgerung

‣ Single-Domain‒ Höchster F-Score

Meiste Trainings-Daten

Alle Features

‣ Cross-Domain‒ Höchster F-Score

Training auf Kamera-Domain

Test auf Movie-Domain

Ohne Token-Feature

Danke für eure Aufmerksamkeit!

extracting opinion targets in a single- and cross-domain ... · 1 extracting opinion targets in a...

Documents

extracting context

extracting monomers

extracting parallelism from legacy sequential code … ·...

an empirical machine learning approach to extract...

extracting minerals.pdf

extracting opinion topics for chinese opinions using...

extracting randomness

casablanca.pkcasablanca.pk/surgical/dental.pdf · dental...

opinion mining for extraction of opinion word and opinion...

syntactic patterns versus word alignment: extracting...

perfumes extracting

joint propagation and refinement for mining opinion words...

ai and opinion mining - github pages · opinion mining, a...

extracting ruby gem

extracting user interests from log using long-period...

syntactic patterns versus word alignment: extracting...

research article extracting product features and opinion...

expert collection -...

aroma: a recursive deep learning model for opinion mining...

twitter opinion topic...