Skip to content
sap_data_hub_2
Fabian ZollikoferOktober 20192 min read

SAP Data Hub & SAP Data Intelligence


sap_data_hub_2


Eine Einordnung

Durch den Fokus der SAP auf Cloud Entwicklungen erhöht sich derzeit die Anzahl von Produkten unterschiedlichen Umfangs im SAP Portfolio. Beispielhaft ist im Finance- und Analyticsbereich die SAP Analytics Cloud als sehr umfangreiche Reporting-, Planungs- und Predictive-Lösung mittlerweile allgemein bekannt, als Produkt kleineren Umfangs wäre der SAP Analytics Hub zu nennen. Diese steigende Zahl von Produkten macht es (im Zusammenspiel mit den üblichen Umbenennungen von SAP-Produkten) manchmal schwer, den Überblick zu behalten.

Aus diesem Grund möchte ich an dieser Stelle einen weiteren Neuankömmling im SAP Portfolio behandeln und verorten. Es handelt sich (wie erwartet) um ein Cloud-Produkt namens (aktuell) SAP Data Hub (bei Installation auf einer SAP-fremden Cloud-Umgebung), bzw. SAP Data Intelligence als Service auf der SAP Cloud Platform. An sich gehören diese beiden Produkte allerdings zusammen und sollen auch im Verlauf dieses Jahres zusammengeführt werden – vermutlich unter neuem Namen. Im Folgenden werde ich allerdings konsistent die Bezeichnung SAP Data Hub verwenden.

Die Aufgaben, die dieses Produkt übernehmen soll, sind Datenidentifikation, -verfeinerung, -pflege und -orchestrierung in verteilten Systemlandschaften – ob in der Cloud oder OnPremise.

Damit ist konkret Folgendes gemeint:

sap_data_hub_1

Der allgemeine Anspruch äußert sich denn auch in der Architektur. Der SAP Data Hub setzt auf einem Kubernetes-Cluster auf und nutzt als Elemente seiner Pipelines (Operatoren) hauptsächlich Docker-Container, was an Allgemeinheit vorerst nichts zu wünschen übriglässt. Ein umfangreiches Set an vorgefertigten Operatoren zeigt bereits in dieser frühen Version die Macht der Architektur. An sich ist damit perspektivisch die Entwicklung eigener Operatoren in beliebiger Programmiersprache denkbar – wobei als de-facto-Standard die Verwendung von Python derzeit am Besten integriert ist. Die bereits verfügbaren Verbindungstypen zeigen das Potential:

  • SAP OnPremise-Systeme (ABAP-System, HANA-Datenbank, HANA-XS, BW, VORA, Data Services)
  • Standard-Protokolle (OData, http, IMAP)
  • Datenbanken (Oracle, MySQL, MS SQL)
  • Big Data (Hadoop)
  • Multi-Cloud (Microsoft Azure, Amazon Web Services, Google Cloud Platform, SAP Cloud Platform)

Ob sich die Pflege von Metadaten für die angebundenen Quellen in der Realität konsequent so durchhalten lässt, dass Nicht-IT-Abteilungen tatsächlich effizient mit den entsprechenden Daten arbeiten können, muss sich meiner Ansicht nach noch zeigen.

Auch wenn es in den Möglichkeiten definitiv Überschneidungen zu anderen SAP-Produkten wie HANA SDI, SLT, BW oder SAP Data Services gibt, hat der SAP Data Hub nicht den Anspruch Systeme abzulösen, sondern eine übergreifende Integration zu ermöglichen, da jedes dieser Produkte in irgendeiner Weise eingeschränkt ist.

Insgesamt zeigt sich im SAP Data Hub das Potential, die in der Vergangenheit doch recht abgeschottete SAP-Welt strukturiert mit den (naturgemäß verteilten) Möglichkeiten der Cloud zusammenzubringen.   

VERWANDTE ARTIKEL