SAP Datasphere und HANA SQL – ein perfektes Paar?

Beitrag teilen

In unserer Reihe hybride SAP HANA Data-Warehouse-Architekturen beschäftigen wir uns mit den Kombinationsmöglichkeiten der drei SAP Data-Warehouse-Lösungen.

Im ersten Teil haben wir Ihnen dazu einen Überblick über die wesentlichen Eigenschaften und Stärken der drei Varianten präsentiert und die generelle Motivation für eine hybride Architektur im SAP-DWH-Kontext erörtert. Im Anschluss sind wir detailliert auf Möglichkeiten zur gemeinsamen Nutzung der etablierten Produkte SAP BW/4HANA und SAP HANA eingegangen und haben Vorteile und Herausforderungen herausgestellt.

Abbildung 1: Investitionsfokus der SAP DWH-Produkte | isr.de
Grafik - Investitionsfokus der SAP DWH-Produkte
Abbildung 1: Investitionsfokus der SAP DWH-Produkte | isr.de

Schon in diesem Szenario des ersten Teils konnten wir auch das neueste Data-Warehouse-Produkt von SAP, Datasphere, einbinden, um einen Data-Warehousing-Ansatz, der gleichermaßen auf das BW/4 und ein HANA-natives SQL-DWH setzt, nutzerfreundlich zu integrieren.

Im zweiten Teil der Reihe greifen wir diese Idee wieder auf und beschreiben Wege, mit denen Sie ein modernes und zukunftssicheres Enterprise Data Warehouse auf Basis des offenen SQL-Ansatzes und Datasphere errichten können.

Neues Flaggschiff Datasphere – Warum noch hybrid?

Datasphere ist nach den Plänen von SAP die strategische Cloud-Plattform für das Data Warehousing. Es ist daher nicht ketzerisch zu fragen: Warum reicht es nicht, nur in diese neue Technologie zu investieren und das BW und den offenen SQL-Ansatz zu vernachlässigen? Aus Perspektive des BW haben wir diese Frage bereits im Blog SAP Datasphere – Das Ende von SAP Business Warehouse? für Sie aufbereitet. Nachfolgend geben wir Ihnen einen weiteren Überblick, der auch mit Blick auf das SQL-Data-Warehousing auf Basis der HANA-Plattform dafürspricht, sich (noch) nicht ausschließlich auf die Datasphere zu fokussieren, sondern um Werkzeuge und Methoden zu ergänzen, die aus dem HANA SQL-Ansatz entnommen sind.

Einführungsphase von Datasphere

SAP Datasphere ist seit Ende 2019 erhältlich und befindet sich immer noch in der Markteinführungsphase. SAP versucht den Absatz weiter zu pushen und es gibt bereits erste Kundenreferenzen. Ein massiver Andrang scheint sich allerdings zum jetzigen Zeitpunkt noch nicht einzustellen. In unserer Beratungspraxis verzeichnen wir zwar ein spürbares Interesse, die Leistungsfähigkeit des Produktes und ihr der konkrete Verwendungszweck wirft allerdings noch viele Fragen auf, die sich mangels erprobter praktischer Beispiele derzeit überwiegend nur theoretisch beantworten lassen. Hinzukommt, dass im Verlauf des nächsten Jahres bereits an die 120 Produkterweiterungen geplant sind (s. https://roadmaps.sap.com/ für Datasphere). Als Early Adopter (s. Abbildung 2) hätten Sie in dieser Phase die Möglichkeit, sich mit der Anwendung und den Cloud-Strukturen vertraut zu machen, sowie gegebenenfalls den Vorteil, wichtige Produktanpassungen mitzuprägen und an Verbesserungen teilzuhaben. Ein Einsatz im größeren Umfang macht in dieser Phase allerdings nur Sinn, wenn das aktuelle Funktionsangebot sehr genau Ihren Anforderungen entspricht. Auf diesen kommen wir im nächsten Absatz zu sprechen.
Diffusionstheorie zu Innovationen
Abbildung 2: Diffusionstheorie zu Innovationen | isr.de

Aktuell funktionaler Fokus auf Business User und Self-Service

Zum jetzigen Zeitpunkt fokussiert Datasphere vor allem die Business User aus den Fachbereichen / Lines of Business. Diese sollen in die Lage versetzt werden, weitgehend unabhängig von der zentralen IT und isoliert von anderen Fachbereichen, die für ihre individuellen Auswertungen benötigten Datenstrukturen selbständig aufzubauen und zu verwalten. Datasphere sieht dazu ein Container-Konzept sogenannter Spaces vor, in denen die Fachbereiche isolierte Arbeitsumgebungen finden, um Daten persistent zu halten und insbesondere virtuell verarbeiten zu können. Ein Austausch von Daten zwischen den Spaces ist dabei gleichwohl möglich. Als Best Practice sieht SAP beispielsweise ein oder mehrere von der IT zentral verwaltete Spaces vor, in denen Daten aus verschiedenen Quellsystemen eingehen und von dort in die Fachbereich-Spaces verteilt werden. Auf diese Weise soll ein optimales Verhältnis zentraler Data Governance und individuellem Self-Service erreicht werden. Zur Datenaufbereitung hält die DWH-Anwendungen mit dem Data und dem Business Layer zwei wesentliche Schichten bereit (Abbildung 3), auf die wir an dieser Stelle nur kurz eingehen. Detailliertere Erläuterungen können Sie in unserem Buch SQL Data Warehousing mit SAP HANA nachlesen, in dem wir uns in einem Kapitel Datasphere widmen.
Architektur Datasphere Grafik
Abbildung 3: Architektur Datasphere | isr.de

Im Data Layer soll die Backend-Aufbereitung des Data Warehouse erfolgen. Die Daten können hier vereinnahmt und mithilfe von SQL-Funktionen transformiert und integriert werden. Aus unserer Sicht ist dieser Bereich im Vergleich zu den bewährten Lösungen BW/4HANA und HANA SQL allerdings noch deutlich unterentwickelt. Mechanismen zur Datenhistorisierung, Möglichkeiten zur Implementierung komplexer Logiken, sowie Steuerungsfunktionen zur Datenbeladung sucht man aktuell vergeblich. Dies verdeutlich auch ein Blick auf die geplanten Produkterweiterungen, von denen knapp die Hälfte im Bereich der Datenintegration, Datenmodellierung und Datenbereitstellung liegen und zu denen Kernfunktionen wie bspw. Verbindungsmöglichkeiten zu PostgreSQL, Terradata, and MySQL, Window Functions und Scheduling-Funktionen gehören (s. https://roadmaps.sap.com/ für Datasphere).

Aufbauend auf dem Data Layer findet im Business Layer die semantische Modellierung der Dimensionen und Fakten statt. Den Business Usern wird hier mit grafischen Mitteln oder SQL-Code die Möglichkeit geboten, Daten selbständig nach eigenen Bedürfnissen für ein konsumierendes Frontend aufzubereiten. Nach unserer Einschätzung sind die Funktionen auf dieser Ebene ebenfalls nicht so weit ausgereift wie im BW/4 oder dem nativen HANA-SQL-Ansatz. Für Self-Service-Szenarien halten wir den Stand allerdings schon geeignet und auch hier verspricht die Roadmap laufend neue Funktionen.

Einen großen Vorteil sehen wir darin, dass mit SAP Analytics Cloud unmittelbar ein Frontend zur Datenvisualisierung integriert ist und die semantische Modellierung diese dritte Ebene sehr zielgerichtet unterstützen kann. Durch geeignete Schnittstellen soll zudem auch die Nutzung von Non-SAP-Frontends leicht möglich sein.

Alles im allem zeigt sich beim Blick auf den Funktionsumfang, dass Datasphere aktuell die Business-User-nahen Schichten einer Data-Warehouse-Anwendung betont und hier seine Stärken ausspielt. Eine vollwertige EDWH-Lösung wird die Anwendung erst in den kommenden Jahren werden, da zur Enterprise-Readyness speziell folgende Aspekte aufgearbeitet werden müssen:

  • Modellierung
    Business-getriebene Modellierung unabhängig von der Modellierungsmethode und mit einer klaren Trennung zwischen Designtime & Runtime
  • Data Integration
    Vielfältige Konnektoren zu wichtigen Quellen (SAPI, REST, Kafka), komplexe Transformationen, komplexe Orchestrierung
  • Agiler Entwicklungsprozess bei großen Entwicklerteams
    Möglichkeiten des parallelen Entwickelns in größeren Entwicklerteams durch Sandboxing, Versionskontrolle und DevOps-orientiertes Continuous Integration / Continuous Delivery
  • Life Cycle Management
    Entwicklung und Betrieb nach DevOps-Standards mit Infrastructure as Code und automatisierten Pipelines zur einfachen und kontinuierlichen Weiterentwicklung
  • Operations
    Job Handling und Monitoring
  • User & Authorization Management
    Granulare Berechtigung auf Strukturen und Dateninhalte

SAP betont Nutzen von Hybrid-Strategien

Es kommt daher nicht von ungefähr, dass SAP hybrid-Konstellationen mit den bestehenden DWH-Lösungen BW/4HANA und HANA SQL offen bewirbt. Die Betonung liegt dabei zwar schwerpunktmäßig auf der Verbindung von On-Premises- und Cloud-Produkten und soll den sukzessiven Umstieg in die Cloud verdeutlichen und schmackhaft machen. Insgeheim sollte SAP jedoch klar sein, dass Datasphere gerade auch im Vergleich zu den beiden etablierten SAP-DWH-Produkten momentan noch keine vollwertige EDWH-Lösung darstellt. Dazu fehlen noch zu viele Kernfunktionen, die in hybriden Szenarien abgefangen werden müssen.  

Auf diesen Umstand deutet auch die bis 2040 sehr langfristige Sicherung der BW/4HANA-Unterstützung, sowie die aktuell mit SAP BW Bridge SAP fleißig vorangetriebene Interoperabilität mit dem BW hin.

Auch wir sind der Meinung, dass Sie in den nächsten Jahren beim Blick auf Datasphere eine gestandene EDWH-Lösung nicht aus dem Blick verlieren sollten. BW/4HANA und das native HANA SQL Data Warehousing bieten hierfür sehr gute Optionen. Im zweiten Teil dieses Blogs wollen wir Ihnen verdeutlichen, was in diesem Zusammenhang für eine Heirat von Datasphere und HANA SQL DWH spricht.

Datasphere und HANA SQL – Ein perfektes Paar?

In der Verhaltensbiologie kristallisiert sich in den letzten Jahren immer mehr heraus, dass sich die Volksweisheit „gleich und gleich gesellt sich gern“ in Bezug auf Persönlichkeitsstrukturen für soziale Interaktion und glückliche Beziehungen tatsächlich belegen lässt (s. bspw. https://www.vbio.de/aktuelles/wissenschaft/gleich-und-gleich-gesellt-sich-gern/, https://www.tagblatt-wienerzeitung.at/nachrichten/wissen/mensch/2136808-Soziale-Stabilitaet-laesst-sich-mit-einfacher-Regel-erklaeren.html ). Diese Informationen mag an dieser Stelle eines technischen Blogs zu SAP-Software ungewöhnlich erscheinen. Wir halten die These allerdings ebenfalls für ein schlüssiges Argument, wenn es um die Frage der Beurteilung einer erfolgversprechenden hybriden Architektur mit SAP Datasphere geht.

Zwar wollen wir nicht so weit gehen, Datasphere und anderen DWH-Lösungen eine Persönlichkeitsstruktur beizumessen, auf die wesentlichen inneren Werte, wenngleich aus technischer Sicht, kommt es uns dennoch an. Und dabei stellen wir fest, dass Datasphere eine HANA-Applikation darstellt und auf SAP’s Cloud Plattform Business Technology Platform (BTP) läuft. Im Vergleich zum BW fehlt der SAP-historische ABAP-Stack. Die technische Struktur ist geprägt vom Zusammenspiel der SAP-HANA-Datenbank und Cloud Foundry, einer Umgebung zur Entwicklung und zum Betrieb von Cloud-Applikationen in unterschiedlichen Programmiersprachen (https://www.cloudfoundry.org/).

Datasphere und der offene SQL-Ansatz sind in dieser Hinsicht aus dem gleichen Holz geschnitzt und speziell auf die für das Data Warehousing wesentliche Datenbankentwicklung deckungsgleich. Datasphere ist in den nächsten Jahren vor allem darauf ausgerichtet, die auf dieser Basis bestehenden Data-Warehousing-Funktionen der HANA- bzw. Business Technology Platform in einen mehr oder weniger geschlossenen Anwendungskontext zu bringen, der die Entwickler und Business User an die Hand nimmt und klare Lösungswege mit einfachen Gestaltungsmitteln vorgibt.

Bei einer hybriden Ausrichtung basierend auf Datasphere und HANA SQL genießen Sie daher eine Menge Vorteile. Sie können auf der HANA On-Premises oder in der Cloud schon jetzt damit anfangen in die Jahre gekommene DWH-Strukturen neu aufzusetzen oder auch nur Teile, für die Sie eine individuelle Vorgehensweise benötigen, im HANA SQL DWH zu verarbeiten.

Gleichzeitig können Sie sich mit den Möglichkeiten von Datasphere vertraut machen und Ihre Business User durch einen erhöhten Self-Service noch besser in Ihre unternehmerischen Business-Intelligence-Bestrebungen einbeziehen. Durch die Möglichkeiten der agilen und modellgetriebenen Entwicklung beim HANA-SQL-Ansatz unter Berücksichtigung von DevOps-Prinzipien, sind Sie zudem in der Lage den analytischen Mehrwert schnell und flexibel in ihre unternehmerischen Prozesse einfließen zu lassen und Ihre Produktivität zu steigern.

Langfristig können Sie wahrscheinlich wesentliche Teile Ihrer gesamten DWH-Struktur mit Datasphere abdecken, da Sie in ein paar Jahren auch alle nötigen EDWH-Funktionalitäten vorfinden. Das HANA SQL Data Warehousing kann allerdings auch in diesem Stadium noch gute Dienste leisten, da es die Bereiche Ihrer Data-Warehousing-Prozesse, in denen Sie sehr individuelle Lösungen benötigen, wahrscheinlich weiterhin besser unterstützen kann.

Insgesamt lassen sich nachfolgende Aspekte des Zusammenspiels besonders hervorheben.

EDWH-Modellierung

Datasphere bietet mit ihren Bordmittel keine ausreichenden Möglichkeiten für eine Business-getriebene, flexible Modellierung, die das Durchdringen komplexer Geschäftslogiken wesentlich erleichtert. Sie können einen solchen Modellierungsansatz jedoch in SAP PowerDesigner auslagern und Ihre gesamten EDWH-Strukturen dort grafisch aufbereiten. Die LoB- Modelle können Sie in Datasphere anlegen und profitieren insofern weiterhin von einer klaren Trennung zwischen Fachbereichsinhalten und zentral von der IT verwalteter Inhalte.

Ein sehr wichtiger Aspekt dabei ist, dass Sie die vom PowerDesigner auf Basis Ihrer grafischen Datenmodelle generierten DDL-Statements unmittelbar im EDWH-Space von Datasphere ausführen und somit das Ergebnis des Modellierungsprozesses direkt in Datasphere übertragen können. Dies geschieht über den Zugriff auf die zugrundeliegende Business Technology Platform und die entsprechende HANA-Datenbank (Abbildung 4).

Auf diese Weise ist es Ihnen es möglich, z.B. ein Data-Vault-Modell für den EDWH-Teil zu verwenden, was bei Nutzung der Datasphere-Bordmittel nicht möglich wäre. Durch den generell offenen Ansatz von Datasphere steht es Ihnen zudem frei, auch sonstige nicht-SAP-Software, wie beispielsweise das Modellierwerkzeug ERWin zu verwenden, wenn dies gewünscht ist.

Grafik - EDWH-Modellierung mit SAP PowerDesigner
Abbildung 4: EDWH-Modellierung mit SAP PowerDesigner | isr.de

Datenintegration

Analog zur Modellierung können Sie im Bereich der Datenintegration verfahren. Durch den offenen Ansatz auf Basis von BTP und SAP HANA ist es Ihnen möglich ein Werkzeug zur Datenintegration Ihrer Wahl zu verwenden und den EDWH Space von Datasphere mit Daten zu versorgen. Die Business Technology Platform (BTP) bringt als Unterbau von Datasphere standardmäßig das Paket Smart Data Integration (SDI) mit (Abbildung 5). Ein weiteres kompatibles Produkt von SAP ist Data Intelligence. Die Vorgehensweise funktioniert jedoch grundsätzlich auch mit jedem sonstigen ETL-Tool.

Abbildung 5: Datenintegration über Smart Data Integration | isr.de

Agiler Entwicklungsprozess und Lifecycle Management

Ein weiterer wichtiger Aspekt, den Sie im Zusammspiel von Datasphere und der zugrunde liegenden Business Technology Platform umfassend nutzen können, ist ein agiles Entwicklungsvorgehen und nachhaltiges Lifecycle Management. Im EDWH-Teil können Sie über verschiedene Umgebungen die Entwicklungsqualität sicherstellen und Produktionsausfälle vermeiden.

Über Continuous-Integration- / Continuous-Delivery-Prozesse auf Basis von Versionskontrollsystemen und Automatisierungsservern wie Git und Jenkins können Sie hier kleinteilige Transportpipelines erstellen und im DevOps-Stil schnell und kontinuierlich produktiven Mehrwert generieren. Das Data Warehouse der verschiedenen Lines of Business bleibt davon unberührt und greift mit seinen Strukturen lediglich auf die von der IT benötigten Quellformate zu, die im EDWH Space zur Verfügung gestellt werden (Abbildung 6).

Abbildung 6: Agiler Entwicklungsprozess und Lifecycle Management | isr.de

Getrennt oder unter einem Dach?

Ganz im Sinne unserer Paar-Anspielung stellt sich schließlich die Frage, wie Sie das Zusammenspiel des EDWH-Teils auf Basis der Business Technology Platform und Datasphere räumlich organisieren möchten. Die bisherigen Abbildungen deuteten hier eine Trennung an, bei der die Spaces von Datasphere auf einem anderen Tenant liegen als die BTP- / HANA-EDWH-Inhalte.

Eine Lösung auf einem Tenant und damit unter dem Dach von Datasphere ist gleichwohl möglich und macht die Architektur noch einmal schlanker (Abbildung 7). Insgesamt bieten sich Ihnen hier viele Möglichkeiten Ihr EDWH in der Cloud oder aber falls benötigt noch teilweise On-Premises aufzubauen und den Schritt zu einem Tenant erst zu einem späteren Zeitpunkt zu gehen.

Grafik - Ein-Tenant-Lösung
Abbildung 7: Ein-Tenant-Lösung | isr.de

Fazit

In diesem Teil unserer Reihe Hybride SAP HANA Data-Warehouse-Architekturen haben wir Ihnen das Zusammenspiel von Datasphere und dem nativem HANA SQL Data Warehousing auf Basis der Business Technology Platform vorgestellt. Datasphere ist zwar die strategische SAP-Data-Warehouse-Lösung, aktuell befindet sich die Anwendung allerdings noch in der Einführungsphase und fokussiert vor allem die fachbereichsnahen DWH-Schichten mit einem hohen Self-Service für verschiedene Lines of Business. Für eine umfassende EDWH-Nutzung benötigt die Software daher noch Starthilfe. Der Rückgriff auf die Business Technology Platform als Unterbau von Datasphere und die Nutzung vieler Elemente des nativen HANA-SQL-Ansatzes stellen dabei eine architektonisch schmale, aber wirkungsvolle Möglichkeit dar, die auch langfristig Sinn ergibt. So finden alle DWH-Prozesse technologisch bereits unter dem Dach von Datasphere statt und Sie müssen keine Migrationsszenarien bedenken. Durch den integrierten SQL-Ansatz bleiben Sie darüber hinaus sehr flexibel und für neue Datentools und Entwicklungsmethoden gerüstet. Falls Sie die Data Warehouse Landschaft in Ihrem Unternehmen modernisieren wollen, bietet sich Ihnen die Möglichkeit Datasphere bereits jetzt als zentrale Plattform einzuführen und die Stärken im LoB-orientierten Teil sofort zu nutzen. Da, wo Datasphere noch nicht die volle EDWH-Reife erreicht hat, können Sie auf Basis der Business Technology Platform und SAP HANA gezielt ergänzen. Diese simple Erweiterung der Werkzeuge und Methoden lässt sich gut skalieren und Sie erweitern leidglich dort, wo in Ihrer individuellen Situation der Schuh drückt.
ISR Mitarbeiter Stefan Kahle

KONTAKT

Stefan Kahle
Senior Executive Manager
SAP Information Management

stefan.kahle@isr.de
+49 151 42205 430

Über ISR

Die ISR Information Products AG ist Ihr Experte für Analytics, Prozess-Digitalisierung und Application Management. Mit Blick auf die Bedürfnisse namhafter Kunden konzipieren, modernisieren, implementieren und betreuen unsere ca. 250 Mitarbeiter an sechs Standorten IT-Architekturen, Software-Lösungen und IT-Infrastrukturen. Das Ziel: Ihnen die wirtschaftliche Nutzung von Daten zu ermöglichen.

News Kategorien
News Archiv

Zuletzt erschienen

Nächste ISR Events

[tribe_events_list limit=“3″]