Vortrag im Rahmen der Vorlesung
Data Warehouse
Dozentin: Prof. Dr. Frey-Luxemburger
WS 2011/2012
Referent: Florian Kalisch (GR09)
2 von 14
Rückblick
Aktueller Status
Opinion Mining ◦ Einführung
◦ Einblicke
Nächste Schritte
DWH | WS 2011/2012 | 20.12.2011
3 von 14
Text-Mining
◦ Grundlage: unstrukturierte bzw. semistrukturierte Daten
◦ Prozess mit Schwerpunkt auf
Dokumentaufbereitung
Morphologische Analyse
Syntaktische Analyse
Semantische Analyse
(Text) Mining Methoden
Klassifikation
DWH | WS 2011/2012 | 20.12.2011
4 von 14
Abgeschlossen
Einarbeitung in die Grundlagen des Opinion-Mining
In Bearbeitung ◦ Aufstellen der Prototyp-Anforderungen
◦ Recherche zu Tools für das Opinion Mining
Nicht begonnen ◦ Auswahl des Tools (der Tools)
◦ Praktische Umsetzung des Prototypen
DWH | WS 2011/2012 | 20.12.2011
5 von 14
Extraktion von Informationen aus dem WWW oder Offline-Dokumenten
Fokus: Analyse der enthaltenen Meinungen
Beginn der Forschung: ◦ Identifikation von Meinungsworten
◦ Zuordnung der semantischen Orientierung (positiv, negativ, neutral) zu den Meinungsworten
DWH | WS 2011/2012 | 20.12.2011
6 von 14
Texte mit Meinungsäußerung können aus drei verschiedenen Perspektiven betrachtet werden
1. Sentiment Klassifikation
2. Eigenschaften-basiertes Opinion Mining
3. Vergleichendes Sentence und Relation Mining
DWH | WS 2011/2012 | 20.12.2011
7 von 14
Sentiment Klassifikation ◦ Opinion Mining als Klassifikationsproblem auf
Dokumenten-Ebene
◦ Zuteilung zur Klasse „positiv“ oder „negativ“
◦ Details (Vorlieben oder Abneigungen) der Rezensenten werden nicht betrachtet
Eigenschaften-basiertes Opinion Mining ◦ Arbeitet auf Satzebene
◦ Ziel ist die Aufdeckung von Details
◦ Beispielsatz: „Der Touchscreen des iPhone ist sehr gut.“
Positive Beurteilung des iPhone Touchscreens
DWH | WS 2011/2012 | 20.12.2011
8 von 14
Vergleichendes Sentence und Relation Mining ◦ Eigenschaften von Objekten (Produkten) werden
gegenübergestellt
◦ Beispielsatz: „Der Touchscreen des iPads ist viel besser als der des Motorola Xoom.“
Zusammenfassend: Identifikation von ◦ subjektiv geäußerten Stimmungen
◦ Polarität und Stärke der Äußerungen
◦ und deren Beziehung zum untersuchten Thema
DWH | WS 2011/2012 | 20.12.2011
9 von 14
„Mannschaft der Herzen“ [MieR11]
◦ Rapid Sentilyzer überwachte die Online-Stimmung während der Fußball-WM 2010
◦ Portallösung für Competitive Intelligence analysierte mehr als 1000 Online-Kanäle
DWH | WS 2011/2012 | 20.12.2011
Quelle: http://www.manageit.de/Online-
Artikel/20100910/20100910f%20Rapid-
i%20Social%20Media%20Monitoring%20-
Dateien/image002.jpg
Quelle: http://www.manageit.de/Online-
Artikel/20100910/20100910f%20Rapid-
i%20Social%20Media%20Monitoring%20-
Dateien/image004.jpg
10 von 14
NetBase: Social Intelligence Platform
Nutzen am Beispiel eines NetBase-Kunden [DarS11]
◦ Griechischer Hersteller für Yoghurt
◦ Aufgedeckt mittels traditioneller BI:
Bestverkaufter Yoghurt-Geschmack ist Vanille
◦ Opinion Mining offenbarte:
Große Begeisterung und Leidenschaft existierte zur Geschmacksrichtung Ananas
◦ Operationale Daten zeigten:
Limitierte Produktion und geringe Verkaufsabdeckung für den Ananas Geschmack
DWH | WS 2011/2012 | 20.12.2011
11 von 14
Fflick: Meinungsbasierte Film-Empfehlungen ◦ auf Grundlage der Meinungen von Freunden [AllG11]
◦ Übernahme durch Google für $10 Mio. [AllG11]
◦ Am 26.01.2011 auf offiziellen Youtube Blog mitgeteilt [RajY11]
DWH | WS 2011/2012 | 20.12.2011
Quelle: http://tctechcrunch.files.wordpress.com/2011/01/fflickshot.png?w=640
14 von 14
[AllG11] Allen, J.: Google To Buy Sentiment Analysis Engine, fflick - Search Engine Watch (#SEW). http://searchenginewatch.com/article/2050121/Google-To- Buy-Sentiment-Analysis-Engine-fflick, 19.12.2011.
[DarS11] Darrow, B.: SAP taps NetBase for deep social media analytics. http://gigaom.com/cloud/sap-taps-netbase-for-deep- social-media-analytics/, 19.12.2011.
[HamO10] Hammer, T.: Opinion und Relationship Mining in sozialen Netzwerken. Extraktion von Meinungen und Beziehungen mittels Textmining und sozialer Netzwerkanalyse. VDM Verlag Dr. Müller, 2010.
[InaO10] Ina Kimmling: Opinion Mining, Koblenz, 2010.
[MieR11] Mierswa, I. Dr.: Rapid-i Social Media Monitoring. http://www.manageit.de/Online- Artikel/20100910/20100910f%20Rapid- i%20Social%20Media%20Monitoring%20.htm, 19.12.2011.
[RajY11] Rajaraman, S.: YouTube Blog: Share and share alike: we’ve acquired Fflick. http://youtube- global.blogspot.com/2011/01/share-and-share-like-weve- acquired.html, 19.12.2011.
DWH | WS 2011/2012 | 20.12.2011