Prof. Wahlster über künstliche Intelligenz

Feature | 21. November 2007 von admin 0

Was sind die Grundlagen semantischer Technologien?

Wahlster: Die Semantik ist ganz allgemein die Lehre vom Inhalt. Auf die Informatik übertragen heißt das, Computern die Bedeutung der menschlichen Sprache verständlich zu machen. Heute sind Softwaresysteme und das Internet noch nicht semantisch, sondern von der Syntax geprägt, der korrekten Zusammenfügung von Zeichen zu Zeichenketten. Der Rechner erkennt bei einem Link von einem Dokument auf das andere keinen inhaltlichen Bezug. Mit semantischen Technologien lassen sich diese Verweise auch mit einem Inhalt belegen. Dabei muss allerdings die Mehrdeutigkeit der menschlichen Sprache berücksichtigt werden.

Wie können semantische Technologien die Bedeutung der menschlichen Sprache erfassen?

Wahlster: Es geht um die Verbindung von Begriffen wie in einer großen Enzyklopädie. Semantische Technologien basieren darauf, dass Beziehungen verschiedenster Art zwischen Begriffen definiert werden. Zum Beispiel ist ein Begriff das Gegenteil eines anderen oder mit ihm gleichbedeutend, es gibt Ober- und Unterbegriffe, etwas ist ein Beispiel oder ein typischer Vertreter eines Begriffs. Aus diesem Begriffssystem mit seinem Geflecht von Relationen entsteht ein semantisches Netz, in dem der Rechner dann gewisse Schlussfolgerungen ziehen kann, um fehlende Information abzuleiten.

Welche Möglichkeiten ergeben sich aus dieser Fähigkeit?

Wahlster: Sie ist wichtig für die Interoperabilität von Softwaresystemen, die mit unterschiedlichen Terminologien arbeiten. Der Rechner kann feststellen, ob zwei Begriffe das gleiche bezeichnen, da er über eine maschinenverständliche Inhaltsbeschreibung verfügt. Wenn verschiedene Abteilungen eines Unternehmens jeweils Spezialterminologien entwickeln, ist der Rechner normalerweise hilflos, da die Syntax der Begriffe unterschiedlich ist. Über semantische Beschreibungen ist die Software in der Lage, Begriffe mit gleicher Bedeutung aufzufinden.

Der Rechner kann damit zum Beispiel auch feststellen, dass eine Beschreibung ein Spezialfall einer anderen ist. Wenn etwa in einem Call Center eine Kundenbeschwerde über einen Softwarefehler eingeht, könnte ein semantisches Softwaresystem automatisch erkennen, dass es sich um eine spezielle Variante einer früheren, allgemeineren Anfrage handelt. Das verringert den Aufwand für die Bearbeitung der Reklamation.

Wie lassen sich semantische Beschreibungen erstellen?

Wahlster: Die semantische Annotation von Daten oder Dokumenten erfolgt über Ontologien, die Begriffe und ihre Relationen zueinander in einem formal definierten System beschreiben. Wir verfügen heute über standardisierte Ontologien, etwa die Standard Upper Ontology des IEEE. Mit solchen Universalontologien werden elementare Begriffe wie „Prozess“ oder „Ereignis“ beschrieben. Darunter existieren Ontologien für Branchen und bestimmte Domänen, zum Beispiel die am DFKI entwickelte General User Model Ontology GUMO für die Benutzermodellierung. Mit GUMO lassen sich Kunden in CRM-Systemen so beschreiben, dass die Daten über Unternehmensgrenzen zusammengeführt und abgeglichen werden können, etwa von einem Telekom-Anbieter und einem Versandhändler.

Was sind aktuelle Einsatzbereiche semantischer Technologien?

Wahlster: Ein Beispiel ist der semantische Desktop, der persönliche Dateien so strukturiert, dass der Anwender bei der Suche nicht nur einen stichwortbasierten, sondern auch einen inhaltlichen Zugriff hat. Auch wenn ein Dokument eine bestimmte Zeichenfolge gar nicht enthält, weil stattdessen immer ein anderer Begriff mit äquivalenter Bedeutung verwendet wurde, bekommt man bei der semantischen Desktop-Suche das richtige Ergebnis angezeigt, weil die Begriffe durch Ontologien miteinander verknüpft sind.

Ein anderer Bereich sind automatische E-Mail-Antworten auf bestimmte Anfragen an ein Unternehmen. Wenn es etwa einen Fehler in einem neuen Software-Release gibt, gehen bei dem Hersteller in kurzer Zeit zahlreiche Anfragen dazu ein. Diese E-Mails sind frei formuliert, meinen aber alle das Gleiche. Mit semantischen Technologien lassen sich diese unstrukturierten Daten automatisch verarbeiten. Hat der Rechner das Thema der Anfrage über Ontologien inhaltlich erkannt, kann er direkt einen Link zu dem passenden Patch verschicken.

Welche Anwendungsmöglichkeiten gibt es im Hinblick auf Web-Services?

Wahlster: Bei semantischen Webdiensten spielt das deutsche Projekt „SmartWeb“ eine Vorreiterrolle, das vom Bundesministerium für Bildung und Forschung finanziert und von mir geleitet wurde. Mit SmartWeb haben wir die Grundlagen des semantischen Webs so weit entwickelt, dass der Anwender keine Suchmaschine mehr nutzt, sondern eine Antwortmaschine. Fragt er zum Beispiel nach dem Umsatz von Siemens im Jahr 2006 in Deutschland, liefert die semantische Suche die exakte Zahl. Die stichwortbasierte Suche bei Google dagegen liefert eine Liste von mehreren Hunderttausend Einträgen.

Wenn nun zusätzlich der Umsatz nicht wie im Geschäftsbericht in Euro, sondern in US-Dollar angegeben werden soll, erkennt die semantische Technologie automatisch, dass ein Währungsrechner einzusetzen ist. Dieser einfache Web-Service nutzt dann das Ergebnis des semantischen Suchdienstes als Eingabe und liefert eine neue Zahl. Der Anwender muss sich nicht mehr mit einzelnen Diensten und ihren Ein- und Ausgabedaten befassen. Wenn Services semantisch aufeinander abgestimmt sind, werden sie vom Rechner wie in einem Baukasten zu komplexen, höherwertigen Diensten zusammengefügt.

Das semantische Web nimmt den Anwendern Arbeit ab. Andererseits ist aber auch Aufwand nötig, um die nötigen Metadaten zu hinterlegen. Wie ist das angesichts der Masse an Web-Inhalten zu schaffen?

Wahlster: Das ist ein zentrales Problem. In der Tat wird das semantische Web nicht mehr als ein Versuch bleiben, wenn nicht genug Internetseiten mit Ontologie-Beschreibungssprachen wie der Web Ontology Language (OWL) annotiert sind. Dass die Urheber aller bestehenden Web-Inhalte ihre Seiten nachträglich mit semantischen Beschreibungen versehen, ist jedoch wenig realistisch.

Deshalb brauchen wir eine neue Generation des Internets als Kombination aus dem Web 2.0 mit seiner Benutzerpartizipation und dem Semantic Web. Genau darauf zielt das THESEUS-Programm des Bundesministeriums für Wirtschaft und Technologie ab, an dem neben dem DFKI auch SAP beteiligt ist. Wir brauchen die Anwender, um Webseiten semantisch zu beschreiben, und zwar über eine Massenbewegung wie heute bei Blogs oder Social-Networking-Seiten. Die Endanwender müssen helfen, diese riesige Aufgabe zu lösen, die keine Firma oder staatliche Organisation bewältigen kann.

Die Forschung versucht, die Werkzeuge dafür so einfach wie möglich zu machen. Für die Vergabe von Schlagwörtern auf Foto- oder Videoportalen könnten bei mehrdeutigen Begriffen sofort bestimmte Alternativen angeboten werden. Ein Klick mehr zur Auswahl der gewünschten Bedeutung, und der Anwender klinkt sich bereits in eine Ontologie ein, in der diese Bedeutung mit anderen Begriffen verknüpft wird. Durch die Teilnahme der Benutzer wird semantische Codierung kostengünstig, und das Massenproblem ist zu bewältigen. Allerdings wird der Wechsel vom syntaktischen auf das semantische Web nicht von heute auf morgen, sondern graduell erfolgen. Die heutigen HTML-Dokumente werden nach und nach semantisch angereichert.

Warum sollten sich die Anwender an dieser Aufgabe beteiligen?

Wahlster: Schon im Web 2.0 tragen viele ohne materiellen Anreiz etwas bei, aufgrund des sozialen Phänomens, Mitglied der Community zu sein und am Gesamtergebnis mitzuwirken. Die Leute sind stolz darauf, einen Beitrag zu leisten, der ihnen selbst und anderen zu Gute kommt. Darauf muss man auch beim Semantischen Web setzen.

In welchem Zeitraum werden sich semantische Technologien in der Industrie etablieren?

Wahlster: Ich glaube, dass schon in drei Jahren die semantischen Technologien zu den wichtigsten IT-Technologien überhaupt zählen werden. Gerade im Bereich der Unternehmenssoftware, die schon heute auf die Standardisierung und Modellierung von Prozessen setzt, werden sich semantische Technologien für die Strukturierung des Unternehmenswissens und die Komposition von Diensten durchsetzen.

Wo liegen die Grenzen semantischer Technologien?

Wahlster: Die menschliche Sprache umfasst auch die so genannte Konnotationssemantik, bei der es darum geht, wie der Mensch aufgrund seines individuellen Erfahrungshintergrunds einen Begriff versteht. Nehmen wir den Begriff „Sofa“: Grundsätzlich wissen wir, dass es ein gepolstertes Sitzmöbel für mehrere Personen ist. Vielleicht erinnert sich aber jemand an das Sofa, das bei seiner Großmutter stand, während eine andere Person ein ganz anderes Möbel mit dem Begriff verbindet. Diese Semantik ist persönlich geprägt und äußerst subtil. Solche Konnotationen können und wollen wir dem Rechner natürlich nicht beibringen. Der Computer muss Bedeutung nicht mit allen Nuancen erfassen wie ein Mensch, sondern nur so weit, wie dies für eine effiziente Verständigung zwischen Mensch und Maschine notwendig ist.

Leave a Reply