Informatica Big Data Management-Editionen
Vorteile• Schnellere Markteinführung
innovativer Produkte und Dienstleistungen und optimierte Geschäftsabläufe
• Geringere Kosten für die Verwaltung von Big Data, während Sie die zunehmenden Datenmengen und -komplexitäten im Griff behalten
• Realisierung von Performanceund Kostenvorteilen durch die erweiterte projektübergreifende Einführung von Hadoop
• Minimierung der Risiken durch die Investition in bewährte Datenintegrationssoftware, die die Komplexität neuer Technologien verbirgt und sensible Daten schützt
Wie Sie Petabytes in Profit umwandelnDa das Geschäftstempo zunimmt und die Unternehmen unter dem enormen Wettbewerbsdruck stehen,
ihre Geschäftsabläufe transformieren zu müssen, gibt es nun die Möglichkeit, Datenarchitekturen
zu modernisieren und zu optimieren, damit Daten für die Unternehmen zu einer strategischen
Ressource werden, mit deren Hilfe sie bessere Entscheidungen treffen können.
Unternehmen nutzen Daten, um sich vom Wettbewerb abzuheben und zu wachsen. Sie gewinnen
aus den Daten einzigartige Erkenntnisse, die es ihnen ermöglichen, ihre Rentabilität zu steigern,
Geschäftschancen zu erkennen, ihre Produkte und Dienstleistungen schneller auf den Markt
zu bringen und außergewöhnliche Kundenerfahrungen zu bieten. Zugleich können sie mithilfe
von Daten auch die betriebliche Effizienz erhöhen und die Risiken durch Betrug, Straftaten,
Systemausfallzeiten oder Sicherheitsverletzungen verringern.
Informatica Big Data Management bietet die branchenweit erste und umfassendste Datenverwal-
tungslösung, die speziell für die skalierbare Einspeisung, Verarbeitung, Bereinigung, Steuerung
und Sicherung von Big Data ausgelegt ist. Die Lösung von Informatica vereint Big-Data-Integration,
-Qualität und -Governance sowie den Schutz von Big Data in einer einzigen integrierten Lösung.
Dynamische und optimierte Big-Data-Integration
Informatica Big Data Management gewährleistet eine Dateneinspeisung mit hohem Durchsatz und
skalierbarer Verarbeitung der Datenintegration, damit Geschäftsanalysten bessere Entscheidungen auf
der Basis von Analytics-Werkzeugen der nächsten Generation treffen können. Hunderte vorgefertigte
High-Performance-Konnektoren, Datenintegrationstransformationen und Parser ermöglichen
die schnelle Einspeisung und Verarbeitung praktisch jeden Datentyps auf Big-Data-Plattformen
wie Hadoop, NoSQL und MPP-Appliances. Die programmatische Automatisierung der Prozesse
zur Datenintegration wird durch dynamische Mappings und Parameterisierung sichergestellt.
Produktivität und Wartung werden durch die automatische Generierung des Datenstroms zur
Laufzeit verbessert und vereinfacht, basierend auf Designmustern und nur wenigen Templates.
Dynamische Schemata unterstützen die Verarbeitung flexibler Datenformate. Optimierte Engines
bieten maximale Performance und Ressourcennutzung für eine skalierbare Datenintegration.
Beispielsweise optimiert Informatica Big Data-Workloads mithilfe einer Zusammensetzung aus
MapReduce und der neuen Informatica Blaze-Engine über YARN.
1
Datenblatt
Durchgehende Big-Data-Governance und -Qualität
Durchgängige Big-Data-Governance und -Qualität sorgen dafür, dass Geschäfts- und IT-Anwender
auf die Daten vertrauen können, die sie nutzen. Informatica Big Data Management bietet eine intuitive
Oberfläche, die auch für technisch unbedarfte Anwender geeignet ist, so dass Datenspezialisten,
-analysten und das Unternehmen effektiv zusammenarbeiten können. Das Profiling und die Erkennung
von Daten, darunter das Profiling von Geschäftsregeln, bringen Probleme und Anomalien
bei der Datenqualität ans Licht. Es können problemlos Regeln und Warnungen zum Zwecke
des Monitorings erstellt werden, um Qualitätsprobleme nachzuverfolgen und zu kennzeichnen.
Mithilfe von Datenqualitätsregeln und der Adressvalidierung können in Hadoop-Daten in der richtigen
Skalierung bereinigt und auf ihre jeweiligen Verwendungszwecke vorbereitet werden. Dank der Live-
Daten-Karte, eines universellen Metadatenkatalogs und des Wissensdiagramms zum Durchsuchen,
Erkennen und Verstehen von Unternehmensdaten können auf der Basis von Spark skalierbare
Wissensdiagramme rasch erstellt werden. Die durchgängige Datenverlaufskontrolle über Hadoop
hinaus unterstützt Compliance und eine effektive Ursache-Wirkung-Analyse für die Datenqualität.
Risikoorientierte Datensicherheit bei Big Data
Bei der risikoorientierten Big-Data-Sicherheit werden alle Daten analysiert, um Risiken und
Schwachstellen schnell zu identifizieren und gegen sie vorzugehen. Das erfordert eine 360-Grad-
Ansicht sensibler Daten, die von Risikoanalysen und richtlinienbasierten Schutzmaßnahmen für
gefährdete Daten begleitet wird. Bei der Big-Data-Sicherheit werden durch Unternehmensrichtlinien
und Branchenvorschriften kontrollierte Daten anonymisiert. Informatica Big Data Management bietet
undurchdringliches, dauerhaftes Data Masking als eine Option an, um sensible Daten in Hadoop-
Entwicklungs- und Produktionsumgebungen zu schützen und so die Risiken von Sicherheitsverstößen
zu minimieren.
„Bei allem, was wir tun, orientieren wir uns stets am Kunden. Western
Union hat nun die einzigartige Gelegenheit, mithilfe leistungsstarker
Datenanalysen Trends zu identifizieren, die uns dabei helfen, unser
Geschäft richtig auszurichten, die Kundenzufriedenheit zu erhöhen
und unser Unternehmen so voranzubringen. Wir freuen uns auf die
weitere Zusammenarbeit mit Informatica, um das gesamte Potenzial
unseres globalen Geschäfts und Kundenstamms richtig zu nutzen.“
— Sanjay Saraf, Senior Vice President und Chief Technology Officer,
Western Union
Informatica Big Data Management-Editionen 2
Die wichtigsten FeaturesDatenintegration (ETL) in Hadoop
Diese Lösung enthält eine umfassende Bibliothek vorgefertigter Umwandlungsfunktionen
für die Datenintegration, die nativ in Hadoop ausgeführt werden, so dass Sie Daten jeden Typs
und Umfangs verarbeiten können – von Terabytes bis hin zu Petabytes. In einer visuellen
Entwicklungsumgebung, die im Vergleich zur manuellen Programmierung eine fünfmal höhere
Produktivität unterstützt, kann Ihr IT-Team zügig Datenströme in Hadoop entwickeln.
Dynamische Schemata und Mapping-Vorlagen
Mit Informatica Big Data Management können Sie mithilfe von Mapping-Vorlagen Hunderte Laufzeit-
Datenströme basierend auf nur einer Handvoll Designmuster generieren. Diese Mappings können
ohne Weiteres angepasst werden, um dynamische Schemata wie Internet- und Geräteprotokolldateien
verarbeiten zu können, die bei vielen Big-Data-Projekten anfallen. Dies bedeutet, dass Sie Datenströme
schnell erstellen können, die zudem einfach zu verwalten sind und sich gegenüber veränderten
Schemata resistent zeigen.
Daten-Profiling in Hadoop
Mit dem Entwicklertool von Informatica und einem browserbasierten Analystentool können für die
Daten in Hadoop-Profile erstellt werden. Dies macht es für Entwickler, Analysten und Datenspezialisten
einfacher, die Daten zu verstehen, Probleme mit der Datenqualität früher zu erkennen, Spezifikationen
zu Datenströmen gemeinsam zu erarbeiten sowie die Transformations- und Regellogik für das
Mapping zu validieren.
Informatica Big Data Management ermöglicht eine fünfmal höhere Produktivität gegenüber der manuellen Programmierung, denn die Lösung stützt sich auf eine visuelle Entwicklungsumgebung, die vorgefertigte Transformationen bietet und die Wiederverwendung von Ressourcen fördert.
Informatica Big Data Management-Editionen 3
Datenqualität in Hadoop
Sie können Daten jeden Typs und Umfangs nativ in Hadoop bereinigen, abgleichen und
standardisieren, um verbindliche und vertrauenswürdige Daten bereitzustellen. Verwenden Sie
einen umfassenden Satz vordefinierter Regeln zur Datenqualität, oder erstellen Sie Ihre eigenen
in der visuellen Entwicklungsumgebung Mit der Adressvalidierung können Sie globale Adressdaten
analysieren, bereinigen, standardisieren und anreichern.
Komplexes Daten-Parsing in Hadoop
Informatica Big Data Management vereinfacht den Zugriff auf und das Parsing von komplexen,
unterschiedlich strukturierten, unstrukturierten und branchenüblichen Daten wie z. B. Weblogs,
JSON, XML sowie Gerätedaten. Vorkonfigurierte Parser für Marktdaten und Industriestandards
wie SWIFT, ACORD, HL7, HIPAA und EDI stehen ebenso zur Verfügung.
Universeller Metadatenkatalog
Datenspezialisten und -analysten verfügen nun über eine 360-Grad-Ansicht ihrer Daten – mit einer Live-
Daten-Karte (Live Data Map), einem universellen Metadaten-Katalog und einem Wissensdiagramm
zum Durchsuchen, Erkennen und Verstehen von Unternehmensdaten. Die Live-Daten-Karte stützt
sich auf Spark, um Wissensdiagramme schnell und skalierbar zu erstellen.
Durchgängige Datenverlaufskontrolle
Um dafür zu sorgen, dass die Daten vertrauenswürdig und gesetzeskonform sind, können sich
Datenanalysten und Geschäftsanwender die Datenherkunft durchgängig und transparent anzeigen
lassen. Diese Ansicht beinhaltet einen ausführlichen Verlauf sämtlicher Datenbewegungen und
-transformationen (in Hadoop und in herkömmlichen Systemen) – von den Zielanwendungen den
ganzen Weg zurück zu den ursprünglichen Quellsystemen. Die Zusammenarbeit von Betrieb und IT
sowie die Suchmöglichkeiten werden durch ein Geschäftsglossar mit gängigen Geschäftstermini
verbessert, die sich auf die Datenobjekte und ihre jeweilige Herkunft beziehen.
Permanentes Data Masking in Hadoop
Die Option Persistent Data Masking verbessert Datensicherheit und -schutz durch die Verschleierung
und Anonymisierung sensibler Daten. Da bei den verschleierten Daten der Kontext und die Konsistenz
der referenziellen Integrität erhalten bleiben, können die maskierten Daten in Test-, Analytics- oder
Supportumgebungen verwendet werden.
Universeller Datenzugriff
Ihr IT-Team hat Zugriff auf alle Arten von Transaktionsdaten, die in großen Mengen auftreten,
z. B. RDBMS, OLTP, OLAP, ERP, CRM, Mainframe, Cloud usw. Sie können auch auf Daten
in sozialen Medien, Protokolldateien, auf Maschinen- und Sensordaten, in Hadoop, NoSQL-
Formaten, Dokumenten, E-Mails und andere unstrukturierte oder verschieden strukturierte
Datentypen und Datenspeicher zugreifen.
Informatica Big Data Management-Editionen 4
Ultraschnelle Dateneinspeisung und -extraktion
Sie können auf Big Data zugreifen und diese zwischen den Quell- und Zielsystemen oder direkt
in Hadoop, NoSQL-Datenspeichern oder Ihrem Data Warehouse laden, transformieren und
extrahieren. Ultraschnelle Verbindungen über native APIs zu den Quell- und Zielsystemen mit paralleler
Verarbeitung ermöglichen die Aufnahme und Extraktion von Daten in Hochgeschwindigkeit.
Datenerkennung in Hadoop
Automatisieren Sie die Erkennung von Datendomänen und -beziehungen in Hadoop. Sie können
z. B. kunden- und produktbezogene Datensätze oder sensible Daten wie Sozialversicherungs-
und Kreditkartennummern erkennen, um sie zu maskieren und so Vorschriften einzuhalten.
Verarbeitung natürlicher Sprache (NLP) in Hadoop
Mit einer Liste von Schlüsselwörtern oder -phrasen können Dateneinheiten in Bezug auf Ihre Kunden
und Produkte aus unstrukturierten Daten, z. B. aus E-Mails, sozialen Medien, Versicherungsforderungen,
Aufzeichnungen des Kundendienstes und sonstigen Dokumenten, mithilfe einer Textanalyse und der
Erkennung benannter Einheiten auf einfache Weise extrahiert und klassifiziert werden. Sie können
Stammdaten mit aufschlussreichen Informationen zu Kundenverhalten oder Produkten, z. B. für eine
wettbewerbsorientierte Preisbildung, anreichern.
Einmalige Entwicklung und schnellere Bereitstellung
Das Hadoop-Ökosystem entwickelt sich angesichts neuer Innovationen, die in der Open-Source-
Community ständig hervorgebracht werden, schnell weiter. Big Data Management setzt auf dem
Open-Source-Framework von Hadoop auf und behält die gesamte Transformationslogik in Ihren
Datenpipelines bei. Dies bedeutet, dass die Entwickler Code einmal entwickeln – ohne spezielle
Kenntnisse der Hadoop-Konzepte und -Sprachen – und Datenpipelines einfach bereitstellen
können, ohne bei jeder Änderung in Hadoop ihre Arbeit neu programmieren zu müssen. Folglich
können Hadoop-Innovationen schneller und mit weniger Auswirkungen und Risiken auf
die Produktionssysteme implementiert werden.
Informatica Big Data Management-Editionen 5
Vergleichen Sie diese Informatica Big Data Management-Editionen, und wählen Sie die richtige Option für sich.
Enterprise Advanced
Anbindung an Datenbanken, Hadoop, soziale Medien und Apps
● ●
Highspeed-Dateneinspeisung ● ●
Datenintegration in Hadoop ● ●
Pushdown-Optimierung für Datenbanken ● ●
Daten-Profiling und Domänen-Erkennung in Hadoop ● ●
Komplexes Daten-Parsing ● ●
Text-Parsing – Named Entity Recognizer (NER) ● ●
Dynamische Schemata und Mapping-Vorlagen ● ●
Universeller Metadatenkatalog ● ●
Durchgängige Datenverlaufskontrolle ● ●
Datenqualität in Hadoop ●
Adressvalidierung in Hadoop ●
GeschäftsglossarBeschränkt auf Big-Data-Umgebungen
100 Named-User für Informatica Data Analyst ● ●
Support (ausschließlich in Abonnement-Lizenzen enthalten)
8 x 5 24 x 7
Informatica Big Data Management-Editionen 6
IN06_1012_02194Informatica GmbH, Ingersheimer Str. 10, 70499 Stuttgart Tel.: +49 (0) 711 139 84-0 Gebührenfrei in den USA: 1.800.653.3871www.informatica.com/de www.informatica.com linkedin.com/company/informatica twitter.com/Informatica
© Copyright Informatica LLC 2018. Alle Rechte vorbehalten. Informatica® und Put potential to work™ sind Marken oder eingetragene Marken der Informatica Corporation in den USA und in anderen Ländern. Alle weiteren Firmen- und Produktbezeichnungen können Handelsnamen oder Marken sein.
Informationen zu Informatica
Informatica ist einer der weltweit führenden unabhängigen Anbieter von Software und wegweisenden Innovationen für „All Things Data“. Unternehmen auf der ganzen Welt setzen auf Informatica, um das Potenzial ihrer Informationen zu erschließen und wichtige Geschäftsnotwendigkeiten zu verwirklichen. Weltweit nutzen über 5.800 Unternehmen Informatica, um den Wert ihrer sich vor Ort, in der Cloud oder dem öffentlichen Internet, inklusive sozialer Netzwerke, befindlichen Informationsbestände optimal zu nutzen.
HauptvorteileSchnellere Markteinführung innovativer Produkte und Dienstleistungen
Mit Informatica Big Data Management können sich Ihre Datenspezialisten und -analysten auf
die Gewinnung neuer Dateneinblicke konzentrieren und müssen sich nicht mit der Integration
der Daten beschäftigen. Und anhand dieser Einblicke kann Ihr Unternehmen dann innovative
Produkte und Dienstleistungen entwickeln. Die Lösung bietet eine Entwicklungsumgebung
für die Datenintegration, in die bestehende PowerCenter®-Mappings importiert werden können. Dabei
können Sie auf vorhandenes Informatica Wissen aufbauen. Sie umfasst eine anwendungsfreundliche
visuelle Entwicklungsumgebung und unterstützt wiederholbare Entwicklungsvorgänge. Sie erweitert
Datenintegration und -qualität auf Daten aus sozialen Medien und Weblogs, Daten von Messgeräten,
Daten in Dokumenten und E-Mails und anderen unterschiedlich strukturierten oder unstrukturierten
Daten ganz ohne manuelle Programmierung. So können Sie mit dieser Lösung die Produktivität Ihres
IT-Teams drastisch steigern und die Bereitstellungszeiten verkürzen.
Geringere Projektkosten für Big Data
Informatica Big Data Management reduziert die Kosten im Zusammenhang mit Big Data. Sie können
Ihre Warehouse- und Quellsysteme entlasten und die Verarbeitung der Daten auf kostengünstigere
Hardware verlagern. Da Sie keine manuelle Programmierung mehr vornehmen müssen, sondern
bewährte Produktivitätstools für die Datenintegration einsetzen, können Sie Ihre Produktivität
um ein Fünffaches steigern. Sie können sie einmal konzipieren und überall einsetzen. Dadurch
werden die Kosten dauerhaft gesenkt, da die Datenverarbeitung sowohl auf vorhandenen
Datenplattformen als auch mit neuen Technologien wie Hadoop optimiert wird.
Unternehmensweite Einführung von Hadoop
Informatica Big Data Management ermöglicht eine breiter angelegte, projektübergreifende
Einführung von Hadoop. Sie müssen keine manuelle Programmierung in Java MapReduce,
Python oder in Skriptsprachen vornehmen, um die Leistungs- und Kostenvorteile von Hadoop
zu realisieren. Stattdessen greifen Sie für Ihre Big-Data-Projekte einfach auf die über 100.000
in Informatica geschulten Entwickler aus der ganzen Welt zurück. Diese Lösung ist einfacher
zu verwalten und unterstützt mehrere Big-Data-Projekte. Sie bietet eine optimale, durchgehende
Performance, sorgt für vertrauenswürdige Daten dank der durchgängigen Datenverlaufskontrolle,
integriert Sicherheit zur Risikominimierung und beschleunigt die Bereitstellung.
Minimale Risiken bei der Einführung neuer Technologien
Informatica Big Data Management minimiert die Risiken im Zusammenhang mit neuester
Technologie, wie z. B. Hadoop. Ihre IT-Abteilung muss nur eine Investition tätigen, die dann sowoh
für neu aufkommende Technologien als auch für herkömmliche Dateninfrastrukturen nutzbar ist.
Die Lösung minimiert die Auswirkungen dynamischer Schemata sowie die Risiken beim Schutz
sensibler Daten. Sie bietet einen einheitlichen und konsistenten Ansatz für die Integration aller
Arten von Daten. Angesichts der Tatsache, dass immer mehr neue Technologien wie Hadoop
entstehen, stellt Informatica Big Data Management sicher, dass Sie Innovationen auf einfache
Weise einführen können, ohne Ihre Mappings und Datenströme neu aufbauen zu müssen.