data warehousing abgrenzung, einordnung und anwendungen sebastian hentschel
TRANSCRIPT
Data WarehousingData Warehousing
Abgrenzung, Einordnung und Anwendungen
Sebastian Hentschel
09. Juni 2005 2
09. Juni 2005 3
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 4
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 5
BegriffeBegriffe
Definition nach Inmon (1996):
„A data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management‘s decisions.“
William H. Inmon
09. Juni 2005 6
BegriffeBegriffe
Definition nach Bauer/Günzel:
„Ein Data-Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“
09. Juni 2005 7
BegriffeBegriffe
Definition nach Zeh:
„Ein Data-Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf zugrundeliegende Datenquellen ermöglicht.“
09. Juni 2005 8
BegriffeBegriffe
Data WarehousePhysische DatenbankIntegrierte Sicht auf DatenHäufig historisierte DatenPeriodische Updates, aber keine
VeränderungenAusgangspunkt für OLAP und Data
Mining
09. Juni 2005 9
BegriffeBegriffe
Unterschiede zu klassischen DBMS:– Zusätzlich Datenverdichtung,
Partitionierung, Redundanz– Anwendungssicht, Datensicht,
Entwicklungssicht siehe OLTP/OLAP
09. Juni 2005 10
BegriffeBegriffe
Data Warehouse SystemeInformationssystemKomponenten zur Integration und
AnalyseStatischer Charakter
09. Juni 2005 11
BegriffeBegriffe
Data WarehousingProsess zur Planung, zum Aufbau
und zum Betrieb eines DW-SystemsDynamischer Vorgang von der
Datenbeschaffung über das Speichern bis zur Analyse der Daten
09. Juni 2005 12
BegriffeBegriffe
Data Mart„kleines“ Data Warehouseauf bestimmte Geschäftsprozesse
oder Problemstellungen bezogendezentralEinführung kostengünstiger und
schneller als DW
09. Juni 2005 13
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 14
HistorieHistorie
Triebfedern – Betriebswirtschaftliches Berichtswesen– Statistik– Integration
09. Juni 2005 15
HistorieHistorie
1960er: Executive Information Systems (EIS) 1980er: Management Information Systems (MIS) 1988: EBIS-Architektur von IBM 1992: Einführung DW-Konzept (Inmon) 1993: OLAP (Codd) Heute: Business-Warehouse-Systeme bzw.
Business-Intelligence-Systeme
09. Juni 2005 16
HistorieHistorie
Fehlende Voraussetzungen der Anfangszeit– Schnelle und flächendeckende
Kommunikationstechnologie– Grafische Benutzeroberflächen– Ausreichende, kostengünstige und schnelle
Datenspeicher– Kostengünstige und leistungsfähige
Prozessoren– Große Datenbasen durch integrierte operative
Systeme Scheitern der MIS-Ansätze der 60er, 70er, 80er
09. Juni 2005 17
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 18
AnwendungsbereicheAnwendungsbereiche
Betriebswirtschaft– Informationsbereitstellung zur
erfolgreichen Abwicklung von Geschäftsprozessen (Kennzahlen)
– Analyse zur Untersuchung von Abweichungen und Auffälligkeiten
– Planung– Kampagnenmanagement
09. Juni 2005 19
AnwendungsbereicheAnwendungsbereiche
Wissenschaft (statistical and scientific databases)– Bsp. Project Earth Observing System
Technik– Umweltdaten, geografische Daten– Bsp. Wasseranalysen
09. Juni 2005 20
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 21
Aufbau eines DW-SystemsAufbau eines DW-Systems
Quelle: Uni Kaiserslautern
09. Juni 2005 22
AufbauAufbau
DatenquellenMetadatenOLAP-ServerData Mining
09. Juni 2005 23
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 24
OLAP vs. OLAP vs. OLTPOLTP
OLTP: Online Transactional Processing– Operative Systeme (viele kurze
Transaktionen im Mittelpunkt)– Keine Redundanz, Normalisierung (reine
Lehre)– Aktueller Datenbankzustand– Bsp.: Flugbuchung– Ziel: viele TA pro sek, TA-Sicherheit bei
parallelen Anfragen, Minimierung der Antwortzeit
09. Juni 2005 25
OLAPOLAP vs. OLTP vs. OLTP
OLAP: Online Analytical Processing– Informative Systeme– Große Anfragen– Redundanz notwendig– Historisierung– Tages-/Wochenaktualität ausreichend– Voraggregation– Bsp.: Getränkemarkt (Quelle: Sattler/Saake)– Ziel: Antwortzeit von wenigen sek
09. Juni 2005 26
OLAPOLAP vs. OLTP vs. OLTP
SauflandSWerbung
Umsatz,Portfolio
Quelle: Sattler/Saake
Beispiel
09. Juni 2005 27
OLAPOLAP vs. OLTP vs. OLTP
Anfragen– Wie viele Flaschen Cola wurden letzten
Monat verkauft?– Wie hat sich der Verkauf von Rotwein im
letzten Jahr in den Regionen entwickelt?– Wer sind unsere Top-Kunden?– Von welchem Lieferanten beziehen wir die
meisten Kisten?
09. Juni 2005 28
OLAPOLAP vs. OLTP vs. OLTP
Anforderungen– Ständig neue Anfragen
(Gliederungsebenen, Fokus, …)– Schnelle Berichterstellung– Gleiche Antwortzeit für Standard- und Ad-
hoc-Anfragen– Keine Einbindung von IT-Abteilungen bei
neuer Anfragestruktur
09. Juni 2005 29
OLAP vs. OLTPOLAP vs. OLTP
operativ informativ Typ/Zahl der Anwender
sehr viele Sachbearbeiter
wenige Manager, Controller
Transaktionen kurze Lese-/Schreibtransaktionen
nur Lesen
Struktur der Anfragen einfach komplex Anfragebereich wenige Datensätze viele Datensätze Zahl gleichzeitiger Zugriffe
sehr viele wenige
Datenquellen zentraler Datenbestand
Vielzahl heterogener Quellen
Eigenschaften der Daten
originär, zeitaktuell, dynamisch
abgeleitet, historisiert, integriert, stabil
Datenvolumen MB - GB GB - TB Antwortzeiten ms - s s - min
09. Juni 2005 30
OLAP vs. OLTPOLAP vs. OLTP
OLTP
UPDATE Personal
SET Bonus = Bonus * 1.1,
Gehalt = Gehalt * 0.95
WHERE Name = ‘Meier‘;
UPDATE Kunden
SET Betreuer = ‘Meier‘
WHERE Name = ‘Huber‘;
COMMIT;
OLAP
SELECT MONTH(V.Datum),R.Region,P.Produktfamilie
FROM Verkäufe V ,Produkte P ,Regionen R
WHERE V.ProduktNr = P.ProduktNr
AND V.RegionNr = R.RegionNr
AND YEAR(V.Datum) = 2004
AND P.Produktfamilie = ‘Rotwein‘
GROUP BY MONTH(V.Datum), R.Region
Bsp. Anfragen
09. Juni 2005 31
OLAPOLAP vs. OLTP vs. OLTP
Codd`sche Regeln1. Multidimensionale konzeptionelle Sicht2. Transparenz3. Zugriffsmöglichkeiten4. Konstante Antwortzeiten5. Client/Server-Architektur6. Generische Dimensionalität7. Dynamische Behandlung dünn
besetzter Matrizen
Ted Codd
09. Juni 2005 32
OLAPOLAP vs. OLTP vs. OLTP
Codd`sche Regeln8. Mehrbenutzerunterstützung9. Kreuzdimensionale Operationen10. Intuitive Datenbearbeitung11. Flexible Berichterstellung12. Unbegrenzte Anzahl von Dimensionen
und Klassifikationshierarchien
1995 Erweiterung um 6 weitere Regeln
09. Juni 2005 33
OLAPOLAP vs. OLTP vs. OLTP
FASMI (fast analysis of shared multidimensional information)– Geschwindigkeit– Analysemöglichkeit– Sicherheit– Multidimensionalität– Kapazität
09. Juni 2005 34
AgendaAgenda
1. Begriffe
2. Historie
3. Anwendungsbereiche
4. Aufbau eines DW-Systems
5. OLAP vs. OLTP
6. Fazit
09. Juni 2005 35
FazitFazit
„Wir ertrinken in Informationen und dürsten nach Einsicht.“
John Naisbitt
09. Juni 2005 36
FazitFazit
DW kann helfenAber Einführung allein genügt nichtSorgfältige Planung, Kostenanalyse
und Nutzenabschätzung unumgänglichSonst Gefahr des Scheiterns
Dennoch immenses Marktwachstum
09. Juni 2005 37
FazitFazit
Quelle: http://www. Olapreport.com
09. Juni 2005 38
Vielen Dank für die Aufmerksamkeit…