Als Gardner Knowledge Graphen im Jahr 2019 in ihrem Gardner Hype Cycle for Emerging Technologies auf eine Ebene mit Quantum Computing stellte, war die Häme in Wissenschaftskreisen groß. Knowledge Graphs, also Systematiken, anhand derer Informationen gesucht und verknüpft werden, waren im Grunde nichts Neues.
Schon in den 50er Jahren beschäftigte sich die Wissenschaft mit diesem Konzept der Datenmodellierung. Im Kontext von Expertensystemen waren sie in den 80er Jahren ein vieldiskutiertes Thema und rückten in den 2000ern erneut im Kontext von Semantic Web ins Blickfeld der Forschung. Schließlich verhalf im Jahr 2013 eine Suchmaschine Knowledge Graphs zu ihrem großen Auftritt vor der breiten Bevölkerung: Google prägte den Begriff ‚things not strings‘ und drückte damit aus, dass die Google Suchmaschine nicht nur stumpf nach Buchstaben suchte, sondern zusätzlich jede Benutzeranfrage in den richtigen Kontext setzen konnte. Alles mit dem Ziel bessere, intelligentere Antworten auf Anfragen zu erzielen.
„Stark vereinfacht sind Knowledge Graphs eine Technologie, die versucht, Wissen maschinenverstehbar zu machen“, beginnt Michael Burwig, Innovation Engineer am Innovation Center Potsdam. Der Schwerpunkt liegt dabei im Modellieren der Beziehung zwischen den Dingen. Diese Beziehung wird in einem netzartigen Graph dargestellt.
„Mit Hilfe von Kowledge Graphs lässt sich abbilden, wie wir Menschen die Welt erfassen. Wie wir durchs Leben gehen, Wissen anhäufen und diese Informationen in unseren Köpfen in Beziehung zueinander setzen,“ erklärt Michael Burwig. Diese Fähigkeit ermögliche es dem Menschen, Schlussfolgerungen zu ziehen – mit faszinierenden A-ha Effekten. Letztendlich ist das auch das Ziel einer Business Software: Wissen zu verknüpfen und Lösungen zu finden – und diesen Vorgang im Idealfall zu automatisieren. Potenzielle Anwendungsszenarien gibt es viele: im Bereich von Wissens- und Datenmanagement, Chat Bots oder in so speziellen Use Cases wie das Aufdecken von Versicherungsbetrug. Kurz – überall dort, wo die Auswertungen von Mustern Aussagen über Ausnahmen oder Auffälligkeiten erlaubt.
Die Möglichkeiten von Hybrid AI
Doch Michael Burwig sieht die Umsetzung solch automatisierter Schlussfolgerungen in der Praxis bisher noch nicht. „Hybrid AI, die Kombination von semantischer Technologie, also Knowledge Graphs, und statischen Machine Learning Methoden, die derzeit für die Vielzahl solcher Szenarien verwendet werden, ist jedoch ein wichtiger Schritt in diese Richtung“, erklärt er.
Dr. Jan Portisch, Lead Architekt bei SAP Signavio Value Accelerator Delivery (VAD), erklärt den Unterschied zwischen klassischen Machine Learning-Ansätzen versus Hybrid AI-basiertem Machine Learning folgendermaßen: „Als Grundlage von klassischen Machine Learning-Ansätzen dienen Abzüge bestehender Datenbanken. Auf diesen Datensets – einer statischen Momentaufnahme ohne Kontext – werden Machine Learning-Inhalte aufgebaut. Im Gegensatz dazu sind Knowledge Graphs jederzeit erweiterbar, ‚lernen‘ permanent und bieten damit den aktuellen Bezug, der den statischen Ansätzen fehlt.“
Auch wenn die Technologie nicht neu ist, konnten Knowledge Graphs erst durch das seit den 2000er Jahren massiv gesteigerte Computing Power ihr wahres Potenzial entfalten, erläutert Dr. Jan Portisch. Noch ist das Thema kein fester Bestandteil der Lehre an Universitäten und das Wissen in der Entwicklerbasis daher überschaubar. „Eine weitere Hürde ist auch der hohe Aufwand im Design der Graphen und das notwendige Umdenken über Applikationsgrenzen hinweg. Ein umfassendes, semantisch sauberes Modellieren der Graphen ist für das Ergebnis maßgeblich, doch das Potenzial ist enorm“, fasst Dr. Jan Portisch die Situation zusammen.
In seiner Rolle als Architekt ist Dr. Jan Portisch beteiligt am Aufbau eines zentralen Graphen für prozessbezogenes Wissen bei SAP. SAP Signavio Value Accelerator Delivery (VAD) sammelt und modelliert Prozesswissen aus 50 Jahren SAP, mit dem Ziel, Kunden diese integrierte Sicht auf verschiedene Prozesse zur Verfügung zu stellen. VAD wird perspektivisch eine semantische Suche anbieten: ein Nutzer gibt ein Businessproblem ein, das er lösen möchte, und erhält eine Auflistung, welche Prozesse und Daten eine Auswirkung auf seine Fragestellung haben,“ erläutert Dr. Jan Portisch. Auch als Transition Tool bei einer Migration oder als Presales Tool beim Definieren einer individuellen Kundenlösung könnte dieses Funktionalität zusätzliche Visibilität bringen.
Felix Sasaki, Experte für knowledge graphs & semantische Technologien im Bereich SAP AI, erläutert weitere Vorteile: „Standardbasierte knowledge graph technologies erleichtern die Modellierung von Geschäftsszenarien. Sogenannte Constraints ergänzen die bestehende logikbasierte Modellierung. Da Constraints das Wissen von Geschäftsexperten leicht erfassen können, wird die Modellierung einfacher. Darüber hinaus haben wissensgraphenbasierte Vokabulare wie schema.org weite Verbreitung gefunden und helfen so, eine allgemeingültige Sprache zu finden.“
Entkopplung von Business-Wissen und Applikation
Das Potential dieser Technologie für SAP liegt in der flexiblen Zusammensetzbarkeit von Graphen und damit in der Integration und Komposition von Datenmodellen und letztendlich auch Applikationen.
„Bei diesem Thema ist es wichtig zu verstehen, dass es mit RDF (Ressource Description Framework: einer Syntax, die für die Modellierung von Metadaten für Ressourcen im Internet verwendet wird) einen öffentlichen Standard gibt und Knowledge Graphs insbesondere außerhalb des Corporate Umfelds schon intensiv genutzt werden. Einer der bekanntesten Knowledge Graphs ist Wikidata; ein Beispiel für einen umfangreichen Graph ist DBpedia. Diese Graphen sind öffentlich zugänglich und können auch kommerziell genutzt werden“, erklärt Dr. Jan Portisch.
Hieraus ergeben sich interessante Anwendungsszenarien. So können Corporate Daten (private data) um öffentlich zugänglichen Daten (public data) erweitert werden. Damit könnte ein (SAP-basiertes) Lieferantensystem beispielsweise automatisch zusätzliche Metadaten über Geschäftspartner aus einem Graphen laden, zum Beispiel das Geschäftsfeld, das Firmenlogo oder den Geschäftsführer.
Semantic Glue – Integration by design
Für Michael Burwig liegt ein weiterer Vorteil der Graphen in ihrer flexiblen, in Echtzeit erweiterbaren Struktur und der Möglichkeit der Komposition, dem Verknüpfen verschiedener Graphen, dem sogenannten Semantic Glue, mit dessen Hilfe Datensilos ‚zusammengeklebt‘ werden können. Im Unterschied zu Graphen muss bei einer relationalen Datenbank die Tabellenstruktur von Anfang an definiert sein und ist nur mit großem Aufwand zu ändern. Mit Hilfe von Graphen könnten Metadaten in einem semantischen Datenlayer unabhängig von den in Tabellen gehaltenen Daten der dazugehörigen Applikationen existieren und verknüpft werden. So könnten Daten über verschiedene Produkte und Datensilos hinweg konsolidiert werden.
Bei bestimmten Szenarien haben Graphen enorme Vorteile gegenüber relationalen Datenbanken, beispielsweise den kürzesten Weg zu berechnen oder ein bestimmtes Material mit einem Kundenmaterial in Verbindung bringen. „Hier muss man sich bei einer relationalen Datenbank einmal quer durch die SAP Welt fragen, für einen Graphen ist es eine recht einfache Problemstellung“, begeistert sich Dr. Jan Portisch. Während relationale Datenbanken bei den entsprechenden Anwendungen meist performanter sind, haben Graphen immer dann einen Vorteil, wenn es darum geht, Brücken (Joins) zwischen Datenstrukturen zu bauen und den richtigen Kontext zu erkennen.
Durch ihre Erweiterbarkeit bieten Knowledge Graphs Firmen auch das perfekte Datenmodell, um mit einem kleinen Fußabdruck eine Systemeinführung zu starten und in einem iterativen Prozess das Modell an weitere Lokationen auszurollen und auszubauen. Ein konkretes Beispiel: ein Unternehmen könnte mit nur einem Use Case oder einer Abteilung beginnen und das Modell dann nach und nach auf die gesamte Organisation ausweiten. Zusätzliche Datenmodelle werden dabei über Knoten in den Graphen ‚zusammengeklebt‘.
Der Situation Knowledge Graph – Einer der ersten Knowledge Graphs bei SAP
Einer der bisher am weitesten entwickelten Knowledge Graphs seitens der SAP bildet die Grundlage für das sogenannte ‚Erkunden verknüpfter Situationen‘ im Intelligent-Situation-Automation-Service auf der SAP BTP für Situation Handling in SAP S/4HANA.
Zum Business Hintergrund: Bei circa 4 Prozent der Vorgänge innerhalb eines Unternehmens kommt es zu einer Ausnahme wie beispielsweise einer fehlenden Zahlung, einer verspäteten Lieferung oder einer LKW-Panne, in der ein Mitarbeiter manuell eingreifen muss.
Der Situation Knowledge Graph verknüpft solche Ausnahmen mit zugehörigen Business Entitäten und ermöglicht dem Nutzer ein besseres Verständnis der Situation im Business Kontext – und hilft somit bei der Lösung und der Optimierung der Geschäftsprozesse. Weitere Analysen dieser Ausnahmen zeigen oft Zusammenhänge beispielsweise zu bestimmten Materialien oder Businesspartnern. „Diese Art des Wissens ist heute oft hart kodiert“, sagt Dr. Torsten Leidig, Architekt im Situation Handling Team. Der Knowledge Graph, der die Basis von Intelligent Situation Automation bildet, erlaubt es einem Business Experten oder einem Key User, Prozesse zu modellieren und in einem umfassenden Business Kontext zu verstehen. Ohne zusätzliche Programmierung und basierend auf einfachen Regeln (SAP Business Rules) kann ein erkanntes Problem automatisch gelöst werden.
Dr. Knut Manske, Engineering Lead Situation Handling und Responsibility Management, erklärt den Graphen als eine Schicht, die über verschiedene SAP Anwendungen gezogen wurde. „Wissen, das in unsere Applikationen eingebettet ist, wird herausgezogen und nutzbar für Algorithmen gemacht. Situation Handling läuft parallel zur Applikation, analysiert die Daten und reagiert auf Informationen über Datenänderungen, sogenannte Events. Ziel ist es, über verschiedene Unternehmensbereiche hinweg Lösungen für auftretende Probleme aufzuzeigen“, fasst Dr. Knut Manske die Funktion von Situation Handling zusammen. Kunden und Partner können selbst Situationen definieren, ohne die eigentliche Applikation jemals zu berühren. Derzeit validiert eine ausgewählte Gruppe von Kunden die Lösung.
Ein Ausblick
Noch ist ein Prototyp: Das SAP Innovationsprojekt ‚Business Decision Simulator‘ simuliert Auswirkungen interner, aber auch externer Faktoren auf ein Unternehmen und präsentiert dem Nutzer mögliche Zukunftsszenarien und Empfehlungen für eine adäquate Reaktion. „Eine mögliche Fragestellung wäre: Was bedeutet ein Buschfeuer in Australien für meine Wertschöpfungskette und damit die Zielerreichung meines global agierenden Pharma-Unternehmens in Europa? Zum einen kann Knowledge-Graph-Technologie helfen die komplexen Beziehungen zwischen aktuellen Ereignissen und unternehmensrelevanten Prozessen auszudrücken, zum anderen erleichtert ein umfangreicher Wissensschatz eine bestmögliche Reaktion auf Chancen und Risiken“, veranschaulicht Michael Burwig.
„Das Potenzial von Knowledge Graphen ist – davon kann man zumindest träumen -, dass irgendwann in ferner Zukunft, auf umfassendem Wissen und Erfahrung modellierte Graphen existieren, auf die Programme zugreifen können. Bei jedem Technologie-Wechsel müsste so lediglich die Applikation, aber nicht mehr das darin enthaltene Wissen neu kodiert werden“, antwortet Michael Burwig auf die Frage nach den Möglichkeiten der Graphen-Technologie.
Die Entkopplung von Daten und Applikation und die damit einhergehende Skalierbarkeit von Entwicklungen ist ein wichtiger Aspekt für ein IT-Unternehmen, doch Michael Burwig sieht auch eine Vision, die über den Kontext der SAP hinausgeht: Symbolic AI, Artificial Intelligence, die mit einer großen Anzahl an interdisziplinären Wissensnetzen verknüpft ist, könnte das Potenzial haben, neues Wissen zu generieren, das nicht explizit modelliert wurde. Das Verknüpfen von wissenschaftlichen Texten könnte den Fortschritt bei der Entdeckung neuer Medikamente beschleunigen oder Innovationen zwischen verschiedenen Wissenschaftsdisziplinen aufzeigen, die sich heute nicht explizit austauschen.
In der Geschichte der Menschheit wurden – und werden – Dinge oft mehrfach erfunden, zumindest teilweise aus Unkenntnis anderer, relevanter Erkenntnisse. Die Vernetzung globaler Forschungsprojekte innerhalb einer Disziplin hat in den letzten Jahren durch digitale Inhalte stark zugenommen. In der Verknüpfung von wissenschaftlichen Erkenntnissen über die Grenzen der einzelnen Disziplinen hinaus (beispielsweise aus Mathematik, Biologie, Medizin und Chemie) könnten sich spannende Verbindungen entwickeln und wissenschaftsübergreifende Erfindungen entstehen, beendet Michael Burwig sein Plädoyer für die Knowledge Graphs.
Der Kreislauf zwischen Wissensgraphen, maschinellem Lernen und der Verarbeitung natürlicher Sprache
Die akademischen Gemeinschaften der symbolischen KI und des maschinellen Lernens hatten in der Vergangenheit nur wenige Berührungspunkte in Bezug auf Forschungsmethoden und Forscher. Dies ändert sich gerade – unter anderem durch die sogenannte hybride KI. Dies führt zu verschiedenen Kreisläufen, in denen sich Knowledge Graphs, maschinelles Lernen und die Verarbeitung natürlicher Sprache gegenseitig befruchten. Johannes Hoffart, Leiter des Chief Technology Office der AI Unit bei SAP, erklärt die Beziehung zwischen maschinellem Lernen und Knowledge Graphs wie folgt: „Knowledge Graphs ermöglichen es Datenwissenschaftlern, mit komplexen und heterogenen Datenquellen zu arbeiten. Ihr flexibles Schema kann leicht erweitert werden und enthält leistungsstarke Datenvalidierungsfunktionen. Gleichzeitig erleichtern Knowledge Graphs den Zugang und die Exploration von Daten, da sie Daten und deren Schema so darstellen, dass sie für Menschen (und auch große Sprachmodelle) leichter zu verstehen sind.“
Christian Lieske vom Language Experience Lab der SAP ergänzt zum Verhältnis zur natürlichen Sprachverarbeitung (Natural Language Processing, NLP): „Knowledge Graphs können NLP speisen und von NLP gespeist werden. Nehmen wir als Beispiel die Erkennung neuer Geschäftseinheiten (z.B. eines Firmennamens): ein Knowledge Graph kann NLP über bekannte Entitäten informieren, und NLP kann zusätzliche Entitäten zu einem Knowledge Graph hinzufügen.“
Dieser Artikel gibt einen groben Überblick über Graphen-Technologie. Eine aktuelle Studie, an der Dr. Jan Portisch Portisch mitgewirkt hat, vermittelt tiefere Einblicke: Combining Machine Learning and Semantic Web: A Systematic Mapping Study