>

Daten nicht mehr als Nebenprodukt eines Prozesses, sondern als eigenständiges Produkt, entwickelt von Fachabteilungen, gehandelt auf Marktplätzen. Ein Data Mesh als dezentralisierte Datenarchitektur. Wie können diese modernen Konzepte mit der SAP Business Technology Platform (BTP) umgesetzt werden?

Die Idee, Daten wie ein Produkt zu behandeln, das ist ein neuer Gedanke, der immer mehr Raum in Unternehmen bekommt. „Das ist gerade ein richtiges Hype-Thema“, weiß Wolfgang Epting. Er ist bei SAP Datenspezialist und Solution Advisor Chief Expert.

Im Jahr 2018 kam die Idee des Data Mesh erstmals auf. Es ist ein Paradigmenwechsel, um Daten als Produkt zu betrachten und zugleich ein soziotechnologischer Ansatz für die Erstellung einer dezentralen Datenarchitektur. Nun beschäftigen sich Unternehmen jedweder Größe, Couleur und Branche intensiv damit.

Der Data Mesh-Ansatz adressiert Probleme in der analytischen Datenbereitstellung, die jedes Unternehmen hat. Diese erhoffen sich davon, ihre Datenwertschöpfungskette effizienter zu gestalten, um aus ihren Daten Geschäftsmehrwert zu generieren.

Data Warehouse

Dazu muss man die Historie kennen: Die erste Idee vieler Unternehmen war, alle Daten aus den operationalen Systemen strukturiert auf einer Plattform zusammen zu bringen. Die Data Warehouses dieser Welt entstanden, aufbereitet für die analytische Wiederverwendung.

„Dann hat man festgestellt, dass es immer mehr neue unstrukturierte Datentypen gab, wie IoT- oder Social Media-Daten. Jedes Unternehmen wollte dann damals einen Data Lake haben. Ohne genau zu wissen, was der Sinn dafür ist. Aber, das war letztlich auch nicht der Stein der Weisen“, sagt Epting.

Data Lakehouse

Unternehmen versuchten infolge beides, Data Warehouses und Data Lakes, zusammen zu bringen und haben dieses Konzept als Data Lakehouse bezeichnet. All diesen Annäherungen gemeinsam war, dass es eine zentrale Herangehensweise war. Es gab Daten-Teams, und es gab Infrastruktur-Teams.

„Das Problem war, dass die Menschen in diesen Teams wenig Wissen über die Geschäftszusammenhänge und die Semantik der Daten hatten“, sagt Epting. „Diese Domain Knowledge sitzt nun mal im Business, im Einkauf, im Verkauf oder im Personalwesen. Dort weiß man, was sich hinter den Daten verbirgt. Der IT muss man das erst erklären.“ Die Folge war: Die zentralen Abteilungen waren chronisch überlastet. „Es wurde nicht nur nicht das produziert, was gebraucht wurde, sondern auch noch alles viel zu langsam.“

Data Mesh

Um diese bekannten Schwachstellen zu überwinden, gibt es jetzt das Konzept Data Mesh. Die Verantwortung für die Datenbereitstellung wird hier dezentral, nämlich in den Geschäftsbereichen, organisiert. Zum anderen sollen die Daten nun wie Produkte behandelt werden.

Epting gibt folgendes Beispiel: Wenn ein Unternehmen in der Realwirtschaft ein neues Produkt auf den Markt bringen will, setzt es dafür einen Produktmanager ein, der es von Anfang bis Ende verantwortet. Dieser überlegt sich: Wo bekomme ich die Rohstoffe für das Produkt dafür her, wie kann ich es fertigen, und wie am Ende sicher auf den Markt bringen? Der Produktmanager müsste auch entscheiden, ob die Welt dieses neue Produkt überhaupt braucht.

Dezentrale Datenprodukt-Teams übernehmen

All diese Aufgaben soll bei der Entwicklung von Datenprodukten in Zukunft der Datenproduktmanager übernehmen. In dezentralen Datenprodukt-Teams soll nur das produziert werden, was dem Unternehmen tatsächlich nützt, weil es einen Mehrwert hat.

In der Theorie wird auf diese Weise nichts mehr doppelt produziert. Das fertige Produkt kann und soll aber auch in andere Datenprodukte eingebaut werden können. Diese werden dann miteinander verwoben und bilden wiederum neue. So entsteht ein Netz von Datenprodukten: das Data Mesh. Dabei gilt: Die Freiheit der Teams ist größer als heute, zudem dem Bedarf entsprechend, und die Entwicklung erfolgt in kürzerer Zeit.

 Voraussetzungen und Verantwortlichkeiten

„Das alles wird nicht über Nacht gehen“, weiß Epting von SAP. „Data Mesh ist auch ein soziotechnologisches Phänomen. Man braucht viele organisatorische Voraussetzungen und klare Verantwortlichkeiten für die einzelnen Geschäftsdomänen. Hinzu kommt Technologie, die das Data Mesh unterstützen muss.“

Bisher hatte ein Vertriebsleiter keine Verantwortlichkeit für Datenprodukte, also für von seiner Abteilung benötigte IT-Lösungen. „Wenn er etwas brauchte, ging er zur IT, diese lieferte dann das Gewünschte. Wenn nun der Vertriebsleiter dafür die Verantwortung übernimmt, ist das eine große Veränderung, die nicht einfach ist. Unternehmen, die diesen Reifegrad nicht besitzen, können den zweiten Schritt vor dem ersten nicht tun“, sagt Epting.

Deshalb mache ein Data Mesh „allein kein Unternehmen über Nacht datengesteuert“. Die Mitarbeiter benötigen auch eine autarke Umgebung, in der sie unbehelligt und ungestört mit den eigenen Daten frei modellieren und Datenprodukte erstellen können.

Vier Prinzipien

Data Mesh beruht auf vier Prinzipien:

  • Eine Self-Serve Data Platform. Die dezentralen Produktteams brauchen eine Plattform, auf der sie Datenprodukte entwickeln und auch publizieren können. Das übernimmt bei SAP unter anderem die Data Marketplace-Funktionalität der SAP Datasphere.
  • Die Teams müssen die technologische Freiheit haben, Datenprodukte frei zu entwickeln. Andererseits darf nicht jeder sein eigenes technologisches Süppchen kochen, sonst droht am Ende Chaos.
  • Es gibt eine Federated Computational Governance als zentrale Vorgabe, wie Datenschutzregeln. Die Produktteams sind für ihre lokale Governance verantwortlich,
  • Das Data as a Product Prinzip: Das Produkt muss auffindbar und vertrauenswürdig sein. Es muss einen Wert entwickeln. Man braucht für die Idee „Data as a Product“ Technologieunterstützung. Hier bringt SAP seine SAP Business Technology Platform

Für den Datenwertschöpfungsprozess bietet SAP verschiedene Lösungen an. Zum einen: Unified Data & Analytics. Dazu gehört die SAP HANA Cloud als Managementplattform für die Daten. Darauf aufbauend die SAP Datasphere und als oberste Schicht für die Visualisierung, für BI und Planning, die SAP Analytics Cloud. Flankierend für das Bewegen der Daten und das Management steht die SAP Data Intelligence Cloud bereit. SAP hat in der SAP Datasphere das Konzept „Spaces“ entwickelt, technologisch gesehen voneinander getrennte Bereiche mit eigener Ressourcenzuordnung.

Demokratisierung von Daten

Data Mesh steht auch für die Demokratisierung von Daten. Es sei kein Wunder, dass sich gerade Startups wie Zalando und HelloFresh in der Öffentlichkeit dazu bekennen, dass sie ein Data Mesh implementiert haben, um agiler zu werden. „Junge Unternehmen haben ein ganz anderes Mindset beim Thema Daten“, sagt Epting. „In meinen Gesprächen stelle ich aber auch fest, dass sich über Jahrzehnte gewachsene Unternehmen sehr intensiv mit dem Thema beschäftigen.“

Durch Data Mesh ändert sich einiges: Das Verhältnis zwischen Fachabteilungen und IT wird neu justiert. „Sie wird nicht mehr immer gefragt und muss auch nicht mehr bei allem mit dabei sein.“ Die Fachabteilungen interessieren sich jetzt auch für die Qualität der Daten. Das Thema Data Governance kommt mit Data Mesh neu auf. Es ist jetzt in den dezentralen Teams verankert, nicht mehr als Hemmnis, sondern als etwas, was die Datenwertschöpfung unterstützen kann.

Studien zeigen: Es gibt einen Zusammenhang zwischen Dezentralität und Umsatz. Firmen, die einen Chief Data Officer haben, erwähnen Daten als Potenzial zur Wertschöpfung in ihren Unternehmensberichten häufiger. „Data Mesh dient hier als Accelerator für den Business Mehrwert. Die Gewinner von Data Mesh sind die Unternehmen als Ganzes“, ist sich Epting sicher.“ Immer mehr Unternehmen machen dabei mit. SAP unterstützt sie dabei.