In unserer Reihe hybride SAPDie SAP SE mit Sitz im baden-württembergischen Walldorf ist ein… HANA Data-Warehouse-Architekturen beschäftigen wir uns mit den Kombinationsmöglichkeiten der drei SAP Data-Warehouse-Lösungen.
Im ersten Teil haben wir Ihnen dazu einen Überblick über die wesentlichen Eigenschaften und Stärken der drei Varianten präsentiert und die generelle Motivation für eine hybride Architektur im SAP-DWH-Kontext erörtert. Im Anschluss sind wir detailliert auf Möglichkeiten zur gemeinsamen Nutzung der etablierten Produkte SAP BW/4HANASAP BW/4HANA ist die aktuelle Data Warehouse Lösung basierend auf… und SAP HANA eingegangen und haben Vorteile und Herausforderungen herausgestellt.
Schon in diesem Szenario des ersten Teils konnten wir auch das neueste Data-Warehouse-Produkt von SAP, Datasphere, einbinden, um einen Data-Warehousing-Ansatz, der gleichermaßen auf das BW/4 und ein HANA-natives SQL-DWH setzt, nutzerfreundlich zu integrieren.
Im zweiten Teil der Reihe greifen wir diese Idee wieder auf und beschreiben Wege, mit denen Sie ein modernes und zukunftssicheres Enterprise Data WarehouseEin Data Warehouse ist für die Ausführung, Überwachung und Steuerung… auf Basis des offenen SQL-Ansatzes und Datasphere errichten können.
Inhaltsverzeichnis
1 Neues Flaggschiff Datasphere – Warum noch hybrid?
1.1 Einführungsphase von Datasphere
1.2 Aktuell funktionaler Fokus auf Business User und Self-Service
1.3 SAP betont Nutzen von Hybrid-Strategien
2 Datasphere und HANA SQL – ein perfektes Paar?
2.3 Agiler Entwicklungsprozess und Lifecycle Management
Neues Flaggschiff Datasphere – Warum noch hybrid?
Einführungsphase von Datasphere
SAP Datasphere ist seit Ende 2019 erhältlich und befindet sich immer noch in der Markteinführungsphase. SAP versucht den Absatz weiter zu pushen und es gibt bereits erste Kundenreferenzen. Ein massiver Andrang scheint sich allerdings zum jetzigen Zeitpunkt noch nicht einzustellen. In unserer Beratungspraxis verzeichnen wir zwar ein spürbares Interesse, die Leistungsfähigkeit des Produktes und ihr der konkrete Verwendungszweck wirft allerdings noch viele Fragen auf, die sich mangels erprobter praktischer Beispiele derzeit überwiegend nur theoretisch beantworten lassen. Hinzukommt, dass im Verlauf des nächsten Jahres bereits an die 120 Produkterweiterungen geplant sind (s. https://roadmaps.sap.com/ für Datasphere). Als Early Adopter (s. Abbildung 2) hätten Sie in dieser Phase die Möglichkeit, sich mit der Anwendung und den Cloud-Strukturen vertraut zu machen, sowie gegebenenfalls den Vorteil, wichtige Produktanpassungen mitzuprägen und an Verbesserungen teilzuhaben. Ein Einsatz im größeren Umfang macht in dieser Phase allerdings nur Sinn, wenn das aktuelle Funktionsangebot sehr genau Ihren Anforderungen entspricht. Auf diesen kommen wir im nächsten Absatz zu sprechen.Aktuell funktionaler Fokus auf Business User und Self-Service
Zum jetzigen Zeitpunkt fokussiert Datasphere vor allem die Business User aus den Fachbereichen / Lines of Business. Diese sollen in die Lage versetzt werden, weitgehend unabhängig von der zentralen IT und isoliert von anderen Fachbereichen, die für ihre individuellen Auswertungen benötigten Datenstrukturen selbständig aufzubauen und zu verwalten. Datasphere sieht dazu ein Container-Konzept sogenannter Spaces vor, in denen die Fachbereiche isolierte Arbeitsumgebungen finden, um Daten persistent zu halten und insbesondere virtuell verarbeiten zu können. Ein Austausch von Daten zwischen den Spaces ist dabei gleichwohl möglich. Als Best Practice sieht SAP beispielsweise ein oder mehrere von der IT zentral verwaltete Spaces vor, in denen Daten aus verschiedenen Quellsystemen eingehen und von dort in die Fachbereich-Spaces verteilt werden. Auf diese Weise soll ein optimales Verhältnis zentraler Data GovernanceWas ist Data Governance? Bei Data Governance handelt es sich… und individuellem Self-Service erreicht werden. Zur Datenaufbereitung hält die DWH-Anwendungen mit dem Data und dem Business Layer zwei wesentliche Schichten bereit (Abbildung 3), auf die wir an dieser Stelle nur kurz eingehen. Detailliertere Erläuterungen können Sie in unserem Buch SQL Data Warehousing mit SAP HANA nachlesen, in dem wir uns in einem Kapitel Datasphere widmen.Im Data Layer soll die Backend-Aufbereitung des Data Warehouse erfolgen. Die Daten können hier vereinnahmt und mithilfe von SQL-Funktionen transformiert und integriert werden. Aus unserer Sicht ist dieser Bereich im Vergleich zu den bewährten Lösungen BW/4HANA und HANA SQL allerdings noch deutlich unterentwickelt. Mechanismen zur Datenhistorisierung, Möglichkeiten zur Implementierung komplexer Logiken, sowie Steuerungsfunktionen zur Datenbeladung sucht man aktuell vergeblich. Dies verdeutlich auch ein Blick auf die geplanten Produkterweiterungen, von denen knapp die Hälfte im Bereich der Datenintegration, Datenmodellierung und Datenbereitstellung liegen und zu denen Kernfunktionen wie bspw. Verbindungsmöglichkeiten zu PostgreSQL, Terradata, and MySQL, Window Functions und Scheduling-Funktionen gehören (s. https://roadmaps.sap.com/ für Datasphere).
Aufbauend auf dem Data Layer findet im Business Layer die semantische Modellierung der Dimensionen und Fakten statt. Den Business Usern wird hier mit grafischen Mitteln oder SQL-Code die Möglichkeit geboten, Daten selbständig nach eigenen Bedürfnissen für ein konsumierendes Frontend aufzubereiten. Nach unserer Einschätzung sind die Funktionen auf dieser Ebene ebenfalls nicht so weit ausgereift wie im BW/4 oder dem nativen HANA-SQL-Ansatz. Für Self-Service-Szenarien halten wir den Stand allerdings schon geeignet und auch hier verspricht die Roadmap laufend neue Funktionen.
Einen großen Vorteil sehen wir darin, dass mit SAP Analytics CloudDer Begriff Cloud stammt aus dem Englischen, zu deutsch „Wolke“…. unmittelbar ein Frontend zur Datenvisualisierung integriert ist und die semantische Modellierung diese dritte Ebene sehr zielgerichtet unterstützen kann. Durch geeignete Schnittstellen soll zudem auch die Nutzung von Non-SAP-Frontends leicht möglich sein.
Alles im allem zeigt sich beim Blick auf den Funktionsumfang, dass Datasphere aktuell die Business-User-nahen Schichten einer Data-Warehouse-Anwendung betont und hier seine Stärken ausspielt. Eine vollwertige EDWH-Lösung wird die Anwendung erst in den kommenden Jahren werden, da zur Enterprise-Readyness speziell folgende Aspekte aufgearbeitet werden müssen:
- Modellierung
Business-getriebene Modellierung unabhängig von der Modellierungsmethode und mit einer klaren Trennung zwischen Designtime & Runtime - Data Integration
Vielfältige Konnektoren zu wichtigen Quellen (SAPI, REST, Kafka), komplexe Transformationen, komplexe Orchestrierung - Agiler Entwicklungsprozess bei großen Entwicklerteams
Möglichkeiten des parallelen Entwickelns in größeren Entwicklerteams durch Sandboxing, Versionskontrolle und DevOps-orientiertes Continuous Integration / Continuous Delivery - Life Cycle Management
Entwicklung und Betrieb nach DevOps-Standards mit Infrastructure as Code und automatisierten Pipelines zur einfachen und kontinuierlichen Weiterentwicklung - Operations
Job Handling und Monitoring - User & Authorization Management
Granulare Berechtigung auf Strukturen und Dateninhalte
SAP betont Nutzen von Hybrid-Strategien
Es kommt daher nicht von ungefähr, dass SAP hybrid-Konstellationen mit den bestehenden DWH-Lösungen BW/4HANA und HANA SQL offen bewirbt. Die Betonung liegt dabei zwar schwerpunktmäßig auf der Verbindung von On-Premises- und Cloud-Produkten und soll den sukzessiven Umstieg in die Cloud verdeutlichen und schmackhaft machen. Insgeheim sollte SAP jedoch klar sein, dass Datasphere gerade auch im Vergleich zu den beiden etablierten SAP-DWH-Produkten momentan noch keine vollwertige EDWH-Lösung darstellt. Dazu fehlen noch zu viele Kernfunktionen, die in hybriden Szenarien abgefangen werden müssen.
Auf diesen Umstand deutet auch die bis 2040 sehr langfristige Sicherung der BW/4HANA-Unterstützung, sowie die aktuell mit SAP BW Bridge SAP fleißig vorangetriebene Interoperabilität mit dem BW hin.
Auch wir sind der Meinung, dass Sie in den nächsten Jahren beim Blick auf Datasphere eine gestandene EDWH-Lösung nicht aus dem Blick verlieren sollten. BW/4HANA und das native HANA SQL Data Warehousing bieten hierfür sehr gute Optionen. Im zweiten Teil dieses Blogs wollen wir Ihnen verdeutlichen, was in diesem Zusammenhang für eine Heirat von Datasphere und HANA SQL DWH spricht.
Datasphere und HANA SQL – Ein perfektes Paar?
In der Verhaltensbiologie kristallisiert sich in den letzten Jahren immer mehr heraus, dass sich die Volksweisheit „gleich und gleich gesellt sich gern“ in Bezug auf Persönlichkeitsstrukturen für soziale Interaktion und glückliche Beziehungen tatsächlich belegen lässt (s. bspw. https://www.vbio.de/aktuelles/wissenschaft/gleich-und-gleich-gesellt-sich-gern/, https://www.tagblatt-wienerzeitung.at/nachrichten/wissen/mensch/2136808-Soziale-Stabilitaet-laesst-sich-mit-einfacher-Regel-erklaeren.html ). Diese Informationen mag an dieser Stelle eines technischen Blogs zu SAP-Software ungewöhnlich erscheinen. Wir halten die These allerdings ebenfalls für ein schlüssiges Argument, wenn es um die Frage der Beurteilung einer erfolgversprechenden hybriden Architektur mit SAP Datasphere geht.
Zwar wollen wir nicht so weit gehen, Datasphere und anderen DWH-Lösungen eine Persönlichkeitsstruktur beizumessen, auf die wesentlichen inneren Werte, wenngleich aus technischer Sicht, kommt es uns dennoch an. Und dabei stellen wir fest, dass Datasphere eine HANA-Applikation darstellt und auf SAP’s Cloud Plattform Business Technology Platform (BTP) läuft. Im Vergleich zum BW fehlt der SAP-historische ABAP-Stack. Die technische Struktur ist geprägt vom Zusammenspiel der SAP-HANA-Datenbank und Cloud FoundryCloud Foundry ist eine Open Source, Multi-Cloud Applikationsplattform, welche Applikationen…, einer Umgebung zur Entwicklung und zum Betrieb von Cloud-Applikationen in unterschiedlichen Programmiersprachen (https://www.cloudfoundry.org/).
Datasphere und der offene SQL-Ansatz sind in dieser Hinsicht aus dem gleichen Holz geschnitzt und speziell auf die für das Data Warehousing wesentliche Datenbankentwicklung deckungsgleich. Datasphere ist in den nächsten Jahren vor allem darauf ausgerichtet, die auf dieser Basis bestehenden Data-Warehousing-Funktionen der HANA- bzw. Business Technology Platform in einen mehr oder weniger geschlossenen Anwendungskontext zu bringen, der die Entwickler und Business User an die Hand nimmt und klare Lösungswege mit einfachen Gestaltungsmitteln vorgibt.
Bei einer hybriden Ausrichtung basierend auf Datasphere und HANA SQL genießen Sie daher eine Menge Vorteile. Sie können auf der HANA On-Premises oder in der Cloud schon jetzt damit anfangen in die Jahre gekommene DWH-Strukturen neu aufzusetzen oder auch nur Teile, für die Sie eine individuelle Vorgehensweise benötigen, im HANA SQL DWH zu verarbeiten.
Gleichzeitig können Sie sich mit den Möglichkeiten von Datasphere vertraut machen und Ihre Business User durch einen erhöhten Self-Service noch besser in Ihre unternehmerischen Business-Intelligence-Bestrebungen einbeziehen. Durch die Möglichkeiten der agilen und modellgetriebenen Entwicklung beim HANA-SQL-Ansatz unter Berücksichtigung von DevOps-Prinzipien, sind Sie zudem in der Lage den analytischen Mehrwert schnell und flexibel in ihre unternehmerischen Prozesse einfließen zu lassen und Ihre Produktivität zu steigern.
Langfristig können Sie wahrscheinlich wesentliche Teile Ihrer gesamten DWH-Struktur mit Datasphere abdecken, da Sie in ein paar Jahren auch alle nötigen EDWH-Funktionalitäten vorfinden. Das HANA SQL Data Warehousing kann allerdings auch in diesem Stadium noch gute Dienste leisten, da es die Bereiche Ihrer Data-Warehousing-Prozesse, in denen Sie sehr individuelle Lösungen benötigen, wahrscheinlich weiterhin besser unterstützen kann.
Insgesamt lassen sich nachfolgende Aspekte des Zusammenspiels besonders hervorheben.
EDWH-Modellierung
Datasphere bietet mit ihren Bordmittel keine ausreichenden Möglichkeiten für eine Business-getriebene, flexible Modellierung, die das Durchdringen komplexer Geschäftslogiken wesentlich erleichtert. Sie können einen solchen Modellierungsansatz jedoch in SAP PowerDesignerClientbasiertes Modellierungswerkzeug, welches ein Leistungsstarkes Modellierungswerkzeug darstellt. Hierbei können eine… auslagern und Ihre gesamten EDWH-Strukturen dort grafisch aufbereiten. Die LoB- Modelle können Sie in Datasphere anlegen und profitieren insofern weiterhin von einer klaren Trennung zwischen Fachbereichsinhalten und zentral von der IT verwalteter Inhalte.
Ein sehr wichtiger Aspekt dabei ist, dass Sie die vom PowerDesigner auf Basis Ihrer grafischen Datenmodelle generierten DDL-Statements unmittelbar im EDWH-Space von Datasphere ausführen und somit das Ergebnis des Modellierungsprozesses direkt in Datasphere übertragen können. Dies geschieht über den Zugriff auf die zugrundeliegende Business Technology Platform und die entsprechende HANA-Datenbank (Abbildung 4).
Auf diese Weise ist es Ihnen es möglich, z.B. ein Data-Vault-Modell für den EDWH-Teil zu verwenden, was bei Nutzung der Datasphere-Bordmittel nicht möglich wäre. Durch den generell offenen Ansatz von Datasphere steht es Ihnen zudem frei, auch sonstige nicht-SAP-Software, wie beispielsweise das Modellierwerkzeug ERWin zu verwenden, wenn dies gewünscht ist.
Datenintegration
Analog zur Modellierung können Sie im Bereich der Datenintegration verfahren. Durch den offenen Ansatz auf Basis von BTP und SAP HANA ist es Ihnen möglich ein Werkzeug zur Datenintegration Ihrer Wahl zu verwenden und den EDWH Space von Datasphere mit Daten zu versorgen. Die Business Technology Platform (BTP) bringt als Unterbau von Datasphere standardmäßig das Paket Smart Data Integration (SDI) mit (Abbildung 5). Ein weiteres kompatibles Produkt von SAP ist Data Intelligence. Die Vorgehensweise funktioniert jedoch grundsätzlich auch mit jedem sonstigen ETL-Tool.
Agiler Entwicklungsprozess und Lifecycle Management
Ein weiterer wichtiger Aspekt, den Sie im Zusammspiel von Datasphere und der zugrunde liegenden Business Technology Platform umfassend nutzen können, ist ein agiles Entwicklungsvorgehen und nachhaltiges Lifecycle Management. Im EDWH-Teil können Sie über verschiedene Umgebungen die Entwicklungsqualität sicherstellen und Produktionsausfälle vermeiden.
Über Continuous-Integration- / Continuous-Delivery-Prozesse auf Basis von Versionskontrollsystemen und Automatisierungsservern wie GitGit stellt ein Softwarerepository da, welches in der Softwareentwicklung einen… und Jenkins können Sie hier kleinteilige Transportpipelines erstellen und im DevOps-Stil schnell und kontinuierlich produktiven Mehrwert generieren. Das Data Warehouse der verschiedenen Lines of Business bleibt davon unberührt und greift mit seinen Strukturen lediglich auf die von der IT benötigten Quellformate zu, die im EDWH Space zur Verfügung gestellt werden (Abbildung 6).
Getrennt oder unter einem Dach?
Ganz im Sinne unserer Paar-Anspielung stellt sich schließlich die Frage, wie Sie das Zusammenspiel des EDWH-Teils auf Basis der Business Technology Platform und Datasphere räumlich organisieren möchten. Die bisherigen Abbildungen deuteten hier eine Trennung an, bei der die Spaces von Datasphere auf einem anderen Tenant liegen als die BTP- / HANA-EDWH-Inhalte.
Eine Lösung auf einem Tenant und damit unter dem Dach von Datasphere ist gleichwohl möglich und macht die Architektur noch einmal schlanker (Abbildung 7). Insgesamt bieten sich Ihnen hier viele Möglichkeiten Ihr EDWH in der Cloud oder aber falls benötigt noch teilweise On-Premises aufzubauen und den Schritt zu einem Tenant erst zu einem späteren Zeitpunkt zu gehen.
Fazit
Stefan Kahle
Senior Executive Manager
SAP Information Management
stefan.kahle@isr.de
+49 (0) 151 422 05 430