r zieht ein in das oracle data warehouse

Download R  zieht ein  in das  Oracle Data Warehouse

Post on 23-Feb-2016

39 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

R zieht ein in das Oracle Data Warehouse. Alfred Schlaucher. Themen. Business Intelligence und Advanced Analytics Vorhersage Algorithmen Oracle Data Miner Oracle R Enterprise . Arbeitsteilung. Business Intelligence. Advanced Analytics. Data Mining. Oracle R Enterprise. - PowerPoint PPT Presentation

TRANSCRIPT

Bringing Big Data to your Data Center

R zieht ein in das Oracle Data WarehouseAlfred Schlaucher

# Business Intelligence und Advanced Analytics Vorhersage Algorithmen Oracle Data Miner Oracle R Enterprise Themen

#2ArbeitsteilungEnterprise Information Layer

User View LayerData Integration Layer

Process neutral / 3 NFBusiness Intelligence

Advanced Analytics

Data WarehouseData MiningOracle R Enterprise

#Aus Merkmalen Wissen filtern

AlterAnzahl KinderVerheiratetVerheiratetEinkommens_GruppeWohnsituationBildungFhrerscheinBerufsttigGeschlechtWohnregionKunde_SeitMehrfachkuferWeinprferenzRaucherIm_Beruf_SeitSelbstndigAngestelltRuhestand_SeitKrank_SeitSportlich_AktivFhrerscheinGeschiedenAnzahl_EhenOnline_AffinittAffinitt_VideospieleLevel_Ausbildung?Predictive Analytics#bersicht Mining-Algorithmen und -VerfahrenKlassificationAssociation RulesClusteringAttribute ImportanceProblemAlgorithmenBedeutung + AnwendungEinteilung von Objekten in Gruppen(bekannte Klassen) anhand von gemeinsamen Merkmalen

Minimum Description Length (MDL)Finden relevanter Merkmale.Fokussierung auf aussagekrftige Attribute Hierarchical K-MeansHierarchical O-ClusterFinden von gemeinsamen Merkmalenzur Bildung von neuen (unbekannten)GruppenAprioriAnalyse von Beziehungen, Warenkorb-Analysen Multiple Regression (GLM)Support Vector MachineVorhersage von Eigenschaften in Abhngigkeit von anderen EigenschaftenRegressionFeature ExtractionNonnegative Matrix FactorizationTextanalysen, Finden von immerwiederkehrenden Mustern

Logistic Regression (GLM)Decision TreesNave Bayes Support Vector MachineOne Class SVMErkennen von Ausressern und AnomalienAnomaly DetectionF1 F2 F3 F4

#55Copyright 2011 Oracle CorporationZeitaufwendige Analyseprozesse

Mehrere Interationen

Workflows von immer wiederkehrenden Arbeitsschritten

Ressourcen-intensive Datenanalysen

Vorhersage Analyse-Schritte und Anforderungen Daten sammelnDatenidentifizierenDaten aufbereitenDaten analysieren#6The solution for these challenges is a nosql db. Is a key value store. These have been around for 40 years. Were isam on mainframe.

Give key value example give customer key and return customer profile.

Nosql database good for apps where just need simple db requests (key/value lookup, no joins) [not new: m/f isam, BDB], use a schema defined dynamically at runtime by the application itself, and have extreme scalability requirements

Whats new: instead of just creating one index, create many indexes and hash to appropriate one.

Analysen in der DatenbankKeine DatenbewegungenKurze Analysezeiten und schnelleres ArbeitenGroe DatenmengenSkalierbarR code und/oder SQLBuilt-in securityInDatabase Analysen Oracle R Enterprise / Oracle Data Mining

SchnellerSkalierbarSicher

#7The solution for these challenges is a nosql db. Is a key value store. These have been around for 40 years. Were isam on mainframe.

Give key value example give customer key and return customer profile.

Nosql database good for apps where just need simple db requests (key/value lookup, no joins) [not new: m/f isam, BDB], use a schema defined dynamically at runtime by the application itself, and have extreme scalability requirements

Whats new: instead of just creating one index, create many indexes and hash to appropriate one.

Beispiel: Un-loyale KundenEinkommenMonate KundenverhltnisMobiltelefon Churner vs. Loyale KundenSource: Inspired from Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management by Michael J. A. Berry, Gordon S. Linoff #8Beispiel: Un-loyale KundenEinkommenMonate KundenverhltnisSegment #1: IF CUST_MO > 14 AND INCOME < $90K, THEN Prediction = Cell Phone Churner, Confidence = 100%, Support = 8/39Segment #3: IF CUST_MO > 7 AND INCOME < $175K, THEN Prediction = Cell Phone Churner, Confidence = 83%, Support = 6/39Source: Inspired from Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management by Michael J. A. Berry, Gordon S. Linoff Mobiltelefon Churner vs. Loyale Kunden#9Oracle Data Miner 11g Release 2 GUI

#10Copyright 2011 Oracle CorporationOracle Data Miner 11g Release 2 GUI

Churner Modell in Abhngigkeit von Einkommen und Dauer des Kundenverhltnisses#11Copyright 2011 Oracle CorporationOPEN SOURCE Sprache und UmgebungSTATISTISCHE BERECHNUNGEN und GraphikSTRKE liegt in der schnellen graphischen Aufbereitung (Plots)>5,300 statistische PackagesLEICHT ERWEITERBAR durch Open Source CommunityR Statistische Programmiersprache

userssaleshistoryreturnsonlinePCA 5

Factor 3Factor 1Clustering 4 Groups281621806040200#Daten-Visualisierung mit R

http://gallery.r-enthusiasts.com/#Auswahl bei den GUIs Bereiche:R Console Plot-BereichErgebnis-BereichMessages

Standard GUI / Rstudio /Rcommander/.../...Graphische Bediener-Oberflchen

#Warum nutzen immer mehr Anwender RWarum RIst schnellIst ansprechbar -offene KommunikationSchlft nichtPointKann mehrIst gnstigerWas kosten die brigen Tools?Oft mehr Funktionen, als in klassischen ToolsNeue Funktionen, sind oft in R als erstes implemtiertDie Entwickler der Funktionen sind oft per Mail direkt erreichbarWeltweit wird mit Rgearbeitet#15> alter geschl geschl.faktor bsp.data.frame

Recommended

View more >