Sensible Daten schützen – künstliche Intelligenz verbessern

Eine Technologie stellt maschinelles Lernen auf Basis sensibler Daten in Aussicht, ohne diese jemals zu entschlüsseln. So funktioniert Homomorphe Datenverschlüsselung.

Um Machine Learning (ML) zu ermöglichen, benötigen intelligente Systeme Zugang zu großen Datenmengen.

Doch wie sicher sind die eingespeisten Daten, wenn es um vertrauliche Informationen geht? Füttert man eine Maschine mit geschützten Daten, können diese dann nicht zurückverfolgt oder schlimmstenfalls gehackt werden? Und heißt das im Umkehrschluss, dass man keine sensiblen Daten für ML einsetzen sollte?

Wir berichteten bereits über die Grundsätze der SAP für den Umgang mit künstlicher Intelligenz (KI). Ein konkretes Beispiel, wie diese Leitlinien im Unternehmen zum Tragen kommen, ist die Homomorphe Datenverschlüsselung.

KI-Grundsatz der SAP „Der Datenschutz und die Privatsphäre stehen immer im Mittelpunkt unseres Handelns.“

Im Gegensatz zu anderen Verfahren, können Daten, die ein Kunde verschlüsselt in die Cloud sendet, durch Homomorphe Verschlüsselung analysiert werden, ohne die Verschlüsselung jemals aufzuheben. Das Ergebnis wird ebenso verschlüsselt zurückgesendet. So kennt niemand außer dem Kunden selbst die Daten oder die Ergebnisse, auch nicht der Cloud-Anbieter, wodurch das Dateneigentum des Kunden vollständig gewahrt bleibt. Diese Vorgehensweise entspricht dem KI-Grundsatz der SAP „Der Datenschutz und die Privatsphäre stehen immer im Mittelpunkt unseres Handelns.“

Maschinelles Lernen; Homomorphe Verschlüsselung in Kürze

Im Gegensatz zu anderen Verfahren ermöglicht die Homomorphe Verschlüsselung (Homomorphic Encryption) die Analyse von verschlüsselten Daten und liefert das gleiche Ergebnis, als ob die Operationen im Klartext durchgeführt worden wären. Die zurückgegebenen Ergebnisse werden ebenfalls verschlüsselt.

Aus nur zwei Operationen, Addition und Multiplikation, kann jede beliebige Funktion aufgebaut werden. Moderne Verschlüsselungsverfahren, die beide Vorgänge in unbegrenzter Anzahl unterstützen, werden daher als „Fully Homomorphic Encryption“-Verfahren bezeichnet.

Homomorphe Verschlüsselung bietet Kunden garantierten Datenschutz und Datensicherheit bei der Abfrage von Datenbanken und der Durchführung von Analysen. Darüber hinaus können damit KI-Fähigkeiten verfeinert und somit mehr Möglichkeiten durch die Verwendung sicherer Kundendaten eröffnet werden. Homomorphe Verschlüsselung trägt zum Erfolg der Cloud-Angebote der SAP bei, obwohl sie nie ein kommerzielles Produkt im eigentlichen Sinne sein wird. Sie ist vielmehr eine Technologie, die SAP nutzen möchte, um Kunden mehr Sicherheit und Schutz für ihre Daten zu bieten.

Weil Datenschutz im Kontext der SAP-Strategie des intelligenten Unternehmens ein entscheidender Erfolgsfaktor sein kann, beschäftigt sich das Team des SAP Innovation Center Network (ICN) mit dem Thema.

Bei Homomorpher Verschlüsselung kommen die Originaldaten „ohne Rauschen“, wie es bei Anonymisierungsansätzen der Fall ist, zum Tragen. „Präziser geht es nicht”, erklärt Axel Schroepfer, Security & Privacy Lead am SAP Innovation Center Dresden und einer der Hauptexperten auf diesem Gebiet. Unternehmen können so auch Analysen an einem gemeinsamen Pool verschlüsselter Daten durchführen, ohne die Daten einander zugänglich zu machen. Diese Art des Datenpoolings ermöglicht es Schroepfer und seinem Team, eine sichere Benchmarking-Lösung für Kunden zu entwickeln. Anhand eines kryptographischen Protokolls können Unternehmen Key Performance Indicators mit Wettbewerbern vergleichen, ohne eine dritte Partei einbeziehen zu müssen oder das Risiko einzugehen, sensible Daten offenzulegen.

Datenschutz ermöglicht vorurteilsfreie KI

Aber es steckt noch mehr dahinter: Die Technologie könnte es ermöglichen, sensible Daten zu verwenden, um ML-Systeme zu trainieren. Das wird im Idealfall dazu führen, dass mehr Unternehmen bereit sein werden, ihre Daten bereitzustellen – und das im absoluten Einklang mit der EU-weiten Datenschutz-Grundverordnung (DGSVO; engl. GDPR) und anderen Datenschutzverordnungen. Gemäß dem KI-Grundsatz „Wir ermöglichen Unternehmen ein vorurteilsfreies Handeln“ kann Homomorphe Verschlüsselung eingesetzt werden, damit KI-Systeme keine verzerrten Entscheidungen aufgrund von nicht-repräsentativen oder anderweitig qualitativ unzureichenden Daten treffen. Oder anders gesagt: Je mehr zuverlässige Daten zur Verfügung stehen, desto besser werden die Resultate. „Nur, wenn die Qualität der Daten für das Modell gut ist, können wir davon ausgehen, dass das Modell nachhaltig gute Entscheidungen trifft“, bestätigt Schroepfer.

Der Schlüssel zum Erfolg: starke Rechenleistung und offener Austausch

Bereits seit vierzig Jahren ist bekannt, dass sich Berechnungen auf verschlüsselten Daten durchführen lassen. Aber die früheren Bemühungen wurden durch begrenzte Rechenleistung behindert, und erst 2009 war die Technik schließlich so weit fortgeschritten, dass die erste vollständig Homomorphe Verschlüsselung möglich war.

Rechenleistung und Speicherplatz sind noch immer erhebliche technische Hürden, da die Verarbeitung verschlüsselter Daten wesentlich mehr Ressourcen erfordert – nämlich 1 Million Mal mehr als bei der Verarbeitung unverschlüsselter Daten oder von Klartext. Dank des technischen Fortschritts der letzten zehn Jahre ist der Einsatz von Homomorpher Datenverschlüsselung inzwischen aber nicht nur denkbar, sondern auch potenziell lohnenswert für immer mehr Anwendungsfälle.

Leistungsstarke und flexible Hardwarelösungen sowie innovative Rechenmaschinen sind eine wichtige Voraussetzung, um mit den neuesten Entwicklungen auf diesem Gebiet Schritt zu halten. Die SAP kooperiert daher mit großen Unternehmen, Universitäten und Startups in regelmäßigen Workshops zur Standardisierung der Homomorphen Verschlüsselung.

Über diese technischen Voraussetzungen hinaus liegt der Schlüssel zum Erfolg auch im Austausch mit anderen Experten. So arbeiten beispielsweise SAP Security Research und das Team von SAP Leonardo Machine Learning Research an ähnlichen Themen und untersuchen weitere Machine-Learning-Trends in Zusammenhang mit Datensicherheit. Das ICN-Team steht im Austausch mit diesen Bereichen, um Input und Feedback zu sammeln. Schroepfer betont: „Wir wollen auf den Stärken der SAP aufbauen. Deshalb ist es wichtig, von Anfang an zusammenzuarbeiten und auf das spezifische Know-how im Unternehmen zurückzugreifen und das Thema effektiv voranzutreiben.”

Das SAP Innovation Center Network

Die Mission des SAP Innovation Center Network (ICN) ist es, künftige geschäftliche Herausforderungen zu lösen, indem es neue Technologien entwickelt und transformative Innovationen bei SAP schafft. Die Abteilung konzentriert sich auf Bereiche, welche die  Stärken der SAP ergänzen und arbeitet eng mit den Branchen und Geschäftsbereichen der SAP zusammen. Mit 180 Mitarbeitern an acht Standorten weltweit hat das ICN unter anderem die Bereiche Machine Learning und Blockchain für SAP erschlossen. Seit Januar 2019 wird das ICN von Torsten Zube geleitet.

Weitere Informationen:

Die Grundsätze für Künstliche Intelligenz von SAP

SAP gründet als erstes europäisches Technologieunternehmen Ethik-Beirat für künstliche Intelligenz

Das SAP Innovation Center Network

SAP AI Ethics and Society

Weitere Artikel zum Thema AI Ethics (Digitalist)

SAP Leonardo Machine Learning Research Blog auf Medium