scopekm: chancen und risiken erkennen mit der textanalytischen lösung luxid®

26
scopeKM Knowledge Management Chancen und Risiken erkennen Vorstellung der textanalytischen Lösung Luxid® Präsentation von Juraj Schick, scopeKM GmbH, Zürich

Upload: scopekm-gmbh-knowledge-management

Post on 26-Jun-2015

2.116 views

Category:

Business


0 download

DESCRIPTION

Monitoring: Der Fokus liegt beim Zuhören und die Darstellung der Ergebnisse in Dashboard, die visuelles Prüfen der Ergebnisse und das Vordringen zu den Daten (Drill down) ermöglichen. Typischerweise erlauben sie das „Grundverständnis“ von Stimmungen über die Zuordnung von Keywords wie z.B. „gut“, „gross“ oder „schrecklich. Textanalyse: Auf allen Plattformen aufbauend, ermöglichen sie das Verstehen der Bedeutungen hinter den Daten. Mit der Computerlinguistik (NLP) werden die Fakten, Meinungen und Stimmungen in den unterschiedlichsten Kanälen erklärt. Mit tiefergehen-den Reports und Visualisierungen erlaubt solche Lösung Vergleiche über längere Zeiträume und zeigt bislang unbekannte Korrelationen auf. Luxid® strukturiert managt und nutzt den unstrukturierten Inhalt Die patentierte und preisgekrönte, auf Computerlinguistik basierende Plattform Luxid® zur inhaltlichen Anreicherung ist die skalierbare Lösung zur Erkennung und Extraktion relevanter und im Fliesstext versteckter Informationsabschnitte und deren Anreicherung mit Metadaten. Die Plattform Luxid® deckt die Information-Assets auf und optimiert deren Management, Verteilung, Zugang und Analyse. Luxid® Annotation Factory mit ihren Funktionalitäten dient als das Pipeline für die Anwendung der Computerlinguistik: Extraktion von Metadaten, Topics, Entitäten und Beziehungen aus dem Text Kategorisierung von Dokumenten und deren Clustering Extraktion-Engine für Syntax, Statistik, Taxonomie, Regeldefinition usw. Luxid® Skill Cartridge Library für Vertiefungen in unterschiedliche Anwendungen bzw. Bereiche, wie z.B. Opinion Mining, Marketing, Medizin Biologie, Pharma usw. Luxid® Content Enrichment Studio für kundenspezifische Anpassungen der bestehenden bzw. Entwicklung von gänzlich neuen Anwendungen.

TRANSCRIPT

Page 1: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Chancen und Risiken erkennenVorstellung der textanalytischen Lösung

Luxid®

Präsentation von

Juraj Schick, scopeKM GmbH, Zürich

Page 2: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

1. Die Erkennung von Chancen und Risiken

2. Das Strukturieren des Unstrukturierten – ein Beispiel

3. Beschreibung der Module

scopeKMKnowledge Management

Agenda

Page 3: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Die heutigen HerausforderungenDezentralisierte Daten Limitierte Analyse * Stovepiped Information

• Stovepiped Information: "Information, die ein spezifisches Problem mit einem begrenzten Fokus beschreibt und die nicht leicht für andere Systeme anwendbar ist." (DOE, USA, 1999)

Page 4: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Universelle Kundenanalysen

Universelle Kundenanalyse

Sammeln, umwandeln, liefern, einführen

• Alle Quellen zusammenführen• In beliebigen Sprachen zuhören • Unternehmenssicherheit und

-wachstum unterstützen• Umsetzbare Erkenntnisse aus

den Kundenfeedbacksschaffen

Page 5: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Monitoring vs. Textanalyse

Charakteristika der marktgängigen Lösungen

�Monitoring: Der Fokus liegt beim Zuhören und die Darstellung der Ergebnisse in Dashboard, die visuelles Prüfen der Ergebnisse und das Vordringen zu den Daten (Drill down) ermöglichen. Typischerweise erlauben sie das „Grundverständnis“ von Stimmungen über die Zuordnung von Keywords wie z.B. „gut“, „gross“ oder „schrecklich.

�Textanalyse: Auf allen Plattformen aufbauend, ermöglichen sie das Verstehen der Bedeutungen hinter den Daten. Mit der Computerlinguistik (NLP) werden die Fakten, Meinungen und Stimmungen in den unterschiedlichsten Kanälen erklärt. Mit tiefergehen-den Reports und Visualisierungen erlaubt solche Lösung Vergleiche über längere Zeiträume und zeigt bislang unbekannte Korrelationen auf.

Page 6: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Die drei Hauptbereiche der Analyse� Jede weitere Schicht der sozialen Analyse liefert höheres Wissen und höhere

Werte für das Unternehmen.

� Dashboards� ZuhörenBetrachten

� Korrelationen� Analyse der Stimmung und MeinungVerstehen

� Umsetzbare Erkenntnisse identifizieren� Risk Management sicherstellenAgieren

Wer

t

Page 7: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Die Lösung „versteht“ die Aussagen, Meinungen und deren Kontext

Interne Daten Externe Daten

Strukturierte Daten

� Datawarehouse� Excel-Tabellen� usw.

� Partner-Datacubes

� usw.

Unstrukturierte Daten

� E-Mails� CRM-Notizen� Umfragen� usw.

� Online-Artikel� Tweets� Facebook-Posts� usw.

�Alle Kanäle werden erschlossen

Page 8: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

ForschungCommunitiesEigenschaften der WebseitenProduktbewertungenBlogs

Verständnis

TwitterFacebookProduktbewertungen

Produktentwicklung

ForumsUmfragenWeb-AnalysenOnline-Feedback

SupportCall CenterCRM-SystemUmfragenSocial Media

Upsell

Social Media-KonversationenUmfragenCustomer Support-FeedbackTransaktionsdaten

ReklamationenMarktforschungUmfragenAuswertungen aus den Äusserungen E-Mails

Chancen auf jedem Touchpoint

Page 9: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

1. Die Erkennung von Chancen und Risiken

2. Das Strukturieren des Unstrukturierten – ein Beispiel

3. Beschreibung der Module

scopeKMKnowledge Management

Agenda

Page 10: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Die Lösung Luxid®

15.08.2014 10

� Die patentierte und preisgekrönte, auf Computerlinguistik basierende Plattform Luxid® zur inhaltlichen Anreicherung ist die skalierbare Lösung zur Erkennung und Extraktion relevanter und im Fliesstext versteckter Informationsabschnitte und deren Anreicherung mit Metadaten.

� Die Plattform Luxid® deckt die Information-Assets auf und optimiert deren Management, Verteilung, Zugang und Analyse.

�Luxid® strukturiert managt und nutzt den unstrukturierten Inhalt

Page 11: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Die drei Schlüsselbereiche der Lösung

15.08.2014 11

Luxid® Annotation Factory mit ihren Funktionalit�ten dient als Pipeline f�r die Anwendung der Computerlinguistik:

� Extraktion von Metadaten, Topics, Entit�ten und Beziehungen aus dem Text

� Kategorisierung von Dokumenten und deren Clustering� Extraktion-Engine f�r Syntax, Statistik, Taxonomie,

Regeldefinition usw.

Luxid® Skill Cartridge Library f�r Vertiefungen in unterschied-liche Anwendungen bzw. Bereiche, wie z.B. Opinion Mining, Marketing, Medizin Biologie, Pharma usw.

Luxid® Content Enrichment Studio f�r kundenspezifische Anpassungen der bestehenden bzw. Entwicklung von g�nzlich neuen Anwendungen.

Page 12: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Mit dem NLP (Computerlinguistik) werden verschiedene sprachliche Repräsentationsebenen sequentiell bearbeitet:

� Tokenisierung. Die Buchstabenkette wird in Wörter, Sätze etc. segmentiert.

� Morphologische Analyse. Die innere Struktur der Wörter wird betr. Bedeutung und Funktion analysiert, um die grammatikalischen Information zu extrahieren und um die Wörter im Text auf Grundformen zurückzuführen.

� Syntaxanalyse. Die Wörter jedes Satzes werden auf ihre strukturelle Funktion im Satz hin analysiert. Der Output zeigt die Wortarten für jedes Wort des Satzes, die Struktur des die Worte beinhaltenden Ausdrucks, Kategorie des Verbs, usw.

� Semantische Analyse. Den Sätzen bzw. ihren Teilen wird in einer Vielzahl von verschiedenen Einzelschritten Bedeutung zugeordnet.

Die Grundlage – NLP Natural Language Processing �Die Fakten, Meinungen und Stimmungen in den Äusserungen zu verstehen

erfordert Verständnis des natürlich gesprochenen/geschriebenen Textes.

Page 13: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Luxid® Annotation Factory � Robuste Metadaten-Extraktion

� UIMA: IBM-Standard, offen, skalierbar � APIs und Web Services� Nahtlose CMS- & Search Integration

� Wirkungsvolle Extraktion mit Skill Cartridges® f�r� Entit�ten� Beziehungen� Kategorien

� Breite Technologiebasis f�r 20 Sprachen� Taxonomien & Thesauri� Semantische Regeln� Statistiken / Automatisches Lernen

� Englisch� Franz�sisch� Deutsch� Holl�ndisch� Italienisch� Spanisch� Portugiesisch� Tschechisch� Russisch� Ungarisch� Polnisch� Griechisch� Schwedisch� D�nisch� Norwegisch� Finnisch� Chinesisch� Japanisch� Koreanisch� Arabisch

Lösung für:

Page 14: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Automatische Extraktion der Metadaten

On May 10th Microsoft bought Skype for $8 Billion.

Terms

Num ProperPrep Verb Proper Prep U NProp Card

CompanyPrep Action Company Prep Monetary Expr.Date

Entities

Relations

AcquisitionPurchaser MicrosoftTarget SkypeAmount $8 billionDate May 10th

On May 10th Microsoft bought Skype for $8 Billion.

Roles

Attributes

Page 15: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Metadaten – aber welche?

� Personennamen: Kunden, Partner, Links zum Verzeichnis� Organisationen: Tochtergesellschaften, Abteilungen, Zulieferer,

Wettbewerber, Partner� Interne Referenzen: Projekte, Verträge, Kunden, geographische

Angaben, Marktsegment.� Produkt- und Servicebezeichnung: Produkttaxonomie, Komponenten,

Optionen� Unternehmensterminologie und -kategorien: technisches Wörterbuch,

Dokumentenkategorisierung

Page 16: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Anreicherung mit MetadatenHTC Strikes Back Against Apple – Wall Street Journal - NIRAJ SHETH May 13th 2010 - HTC Corp., the maker of several phones that run on Google Inc.'s Android platform, filed a complaint against Apple Inc. alleging patent infringement, a move that follows an intellectual-property suit that the iPhone maker filed against HTC two months ago.

HTC's complaint with the U.S. International Trade Commission alleges that Apple has violated five patents held by the Taiwan-based electronics manufacturer and asks the trade court to stop Apple from selling the iPhone, the iPad and iPod in the U.S.

Apple in March filed complaints with the ITC, and in a federal court in Delaware, outlining a total of 20 patents related to touch-screen technology and mobile computing that it alleges HTC infringed. In its filing, HTC cites patents related to power consumption in smartphones and how cellphones dial contacts from an address book. Some of the patents cited by Apple in its suit also relate to power usage, but it wasn't immediately clear how similar those claims are to HTC's.

"We are taking this action against Apple to protect our intellectual property, our industry partners, and most importantly our customers that use HTC phones," HTC's North American vice president, Jason Mackenzie, said in a written statement. In another sign of the growing legal pressure on Google and its Android partners, HTC recently announced a licensing deal with Microsoft Corp., which said it believes that HTC's Android phones infringes on a range of Microsoft patents including user interfaces.

The share of Android-based smartphones in the U.S. grew to 28% in the first quarter, according to research firm NPD, for the first time edging out the iPhone's 21% share.

filed complaints with the ITCfiled complaints with the ITC

filed a complaint against Apple Inc. alleging patent infringementfiled a complaint against Apple Inc. alleging patent infringement

Beziehungen:Court CaseCourt Case

ITCITC

recently announced a licensing deal with recently announced a licensing deal with HTCHTC

LicensingLicensing

American vice presidentAmerican vice president‘s North‘s NorthHTCHTC

HRHR

HTCHTC

AppleAppleGoogleGoogle

US International Trade CommissionUS International Trade Commission

Microsoft CorpMicrosoft Corp

iPhoneiPhone iPadiPad iPodiPod

Jason MackenzieJason Mackenzie

NIRAJ SHETHNIRAJ SHETHAndroidAndroid

smartphonessmartphones cellphonescellphones

user interfacesuser interfaces

power usage power usage

HTCHTC AppleApple GoogleGoogle

Microsoft Corp.Microsoft Corp. NPDNPD

Gesellschaften:

US International Trade CommissionUS International Trade Commission

Organizationen:

Personen:Niraj ShethNiraj Sheth

iPhoneiPhone iPadiPad iPodiPodProdukte:

Technologien:AndroidAndroid smartphonessmartphones

power power usageusage user user interfacesinterfaces

The share of Android-based smartphones in the U.S. grew to 28% in the first quarter The share of Android-based smartphones in the U.S. grew to 28% in the first quarter

Market ShareMarket Share

Jason MackenzieJason Mackenzie

NPDNPD

AppleApple

Page 17: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

1. Die Erkennung von Chancen und Risiken

2. Das Strukturieren des Unstrukturierten – ein Beispiel

3. Beschreibung der Module

scopeKMKnowledge Management

Agenda

Page 18: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Luxid mit den Skill Cartridges

15.08.2014 18

Page 19: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Skill Cartridge® Library

15.08.2014 19

NewsCategories

PeopleCompaniesLocations

BusinessRelationships

TM360°

CompetitiveIntelligence

IPTCChemicalEntitiesRecognition

BiologicalEntitiesRelationships

MedicalEntitiesRelationships

BER

MER

CER

MilitaryPoliticalStrategic

Events

OpinionsSentiment

OpinionMining

RTFSTF…

Page 20: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

Skill Cartridges® (1)

15.08.2014 20

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Statistics-basedSkill Cartridges®

� Regelbasierte Skill Cartridges®, wie z.B. TM360� Eingebettete linguistische Modellierung oder Regeln, z.B. f�r Personen,

Kombination von Faktoreno Eigennamen (Wortarten-Analyse)o Bekannte Vornamen, Titel, usw. (Treiber)o Grossbuchstabeno Kontext (automatisches Lernen)o Begriffserkl�rungen

Page 21: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 21

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Statistics-basedSkill Cartridges®

Skill Cartridges® (2)

� Statistik-basierte Skill Cartridges®� Extraktion relevanter Begriffe aus jeder Dokumentenart� Basis: Referenz-/ Training-Corpus� Ergebnis: Quantitative Analyse � tf/idf *(Term frequency/inverse

document frequency)

* Beurteilung der Relevanz von Termen in Dokumenten einer Dokumentensammlung beim Information Retrieval. Beispiel: Der Begriff �Philosophie� kann h�ufig genannt werden, und die Frequenz ist �hnlich hoch im Referenzcorpus. Der Begriff �norwegische Philosophie� wird h�here Relevanz bekommen, trotz wenig h�ufiger Erscheinung.

Page 22: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 22

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Statistics-basedSkill Cartridges®

� Kategorisierung Skill Cartridges®, wie z.B. IPTC� Themen bestimmen, basierend auf einem Set von Subjekten� Automatische Erstellung und Optimierung von Skill Cartridge� mit

Luxid� Category Workbench� Wiederverwendung existierender Assets: der Inhalt manuell klassifiziert� Sicherstellung von Produktivit�t und Konsistenz

Skill Cartridges® (3)

Page 23: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 23

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Statistics-basedSkill Cartridges®

� Taxonomie-basierte Skill Cartridges®� Smart Taxonomy Facilitator (STF) -Technologie

o Automatische Erweiterung von Varianten mit Fuzzy Term Matchingo Reduktion des Unsch�rferauschens mit Relevance Scoring

� Schnelle und Effiziente Erstellung von Skill Cartridges�� Effiziente Wiederverwendung existierender Assets (Thesaurus,

Taxonomie)� Unterst�tzung von RDF/SKOS (W3C-Standards)� Ausgangspunkt zur semantischen Anreicherung der Inhalte.

Skill Cartridges® (4)

Page 24: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 24

� Business Rules-based Skill Cartridges®� Kundenspezisches Reasoning einfach in den Anreicherungsprozess der

Inhalte integrierbar� Kenntnisse der Computerlinguistik nicht erforderlich� Verf�gbarkeit von Schnittstellen auf einen Klick.

Skill Cartridges® (5)

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Statistics-basedSkill Cartridges®

Page 25: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 25

Taxonomy-basedSkill Cartridges®

Business Rules based Skill Cartridges®

Machine-LearningSkill Cartridges®

CategorizationSkill Cartridges®

Semantic Rules basedSkill Cartridges®

Term-basedSkill Cartridges®

� Machine-Learning Skill Cartridges®� Einfache Erfassung & Anwendung kundenspezifischer Annotationen im

Anreicherungsprozess der Inhalte� Effiziente Wiederverwendung des annotierten Corpus�� Nur rudiment�re Kenntnisse der Computerlinguistik erforderlich.

Skill Cartridges® (6)

Page 26: scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®

scopeKMKnowledge Management

15.08.2014 26

Content Enrichment Studio

Taxonomy-basedSkill Cartridge® Development

KnowledgeEditor

Semantic Rules basedSkill Cartridge® Development

Skill Cartridge®Builder

Categorization Skill Cartridge®Development & Quality Control

CategorizationWorkbench

Quality Control

AnnotationWorkbench