Effiziente Verarbeitung von großen Datenmengen
Andreas Eisenkolb
January 7, 2014
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 1 / 11
Inhaltsverzeichnis
1 Big Data
2 MapReduce
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 2 / 11
Big Data
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 3 / 11
Big Data
speichert ca. 2,5 Petabytes1 Petabyte = 1 048 576 GigabytesIBM Festplatten-Cluster speichert 20 Petabayte 1
1Quelle: http://www.dailytech.com/article.aspx?newsid=22558Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 4 / 11
Was versteht man unter Big Data?
Big Data
Big Data bezeichnet große Datenmengen aus vielfaltigen Quellen, die mitHilfe neu entwickelter Methoden und Technologien erfasst, verteilt,gespeichert, durchsucht, analysiert und visualisiert werden konnena.
aWissenschaftliche Dienste des Deutschen Bundestages
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 5 / 11
Big Data Challenge
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 6 / 11
Die 4 ”Vs” von Big Data
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 7 / 11
Was ist MapReduce?
MapReduce
MapReduce ist ein vom Unternehmen Google Inc. eingefuhrtesProgrammiermodell fur nebenlaufige Berechnungen uber großeDatenmengen auf Computerclustern.
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 8 / 11
Warum MapReduce?
Effiziente Verarbeitung großer Datenmengen
Einfache Benutzung (Fehlerbehandlung, Datenverteilung, etc.)
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 9 / 11
MapReduce
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 10 / 11
Andreas Eisenkolb Effiziente Verarbeitung von großen Datenmengen January 7, 2014 11 / 11