Mit dem Auto auf Du und Du

Feature | 25. April 2005 von admin 0

Klaus Bengler

Klaus Bengler

Herr Bengler, wie soll die Kommunikation zwischen Mensch und Auto noch verbessert werden?

Bengler: Sie soll eindeutiger und natürlicher werden. Nicht nur sprachlich wird das Auto der Zukunft seinen Fahrer immer besser verstehen: Um Missverständnisse und Rückfragen zu minimieren, werden beim Forschungsprojekt Mensch-Maschine-Interaktion mit einer kleinen Kamera auch Mimik und Gestik registriert. So nicken viele Menschen bei der Bejahung einer Frage unwillkürlich mit dem Kopf oder schütteln ihn leicht bei einer Verneinung. Hat das System die Antwort des Fahrers akustisch nicht völlig zweifelsfrei verstanden, hilft die Optik dabei, seine Absicht zu erkennen. Die Spracherkennung wertet sogar den Tonfall eines Menschen aus. Darüber hinaus schauen wir dem Fahrer auf die Hände. So könnte er künftig zum Beispiel den CD-Spieler auch mit einem simplen Fingerzeig aktivieren.

Derzeit konzentriert sich die Forschung der BMW Group unter anderem darauf, Sprachsteuerungssysteme so zu verfeinern, dass Autos nicht nur festgelegte Kommandos, sondern auch die Alltagssprache verstehen. Was sind die größten Schwierigkeiten dabei und wie lassen sie sich lösen?

Bengler: Die Spracherkennung ist bereits sehr komfortabel und robust. Im Moment konzentriert sich die Forschung auf die deutsche Sprache. Die Spracherkennungssysteme, die bereits in Serie sind, gibt es aber auch mehrsprachig. Trotzdem bleiben einige kleine Fehler, die sich aber durch die Kopplung mit anderen Informationsquellen reduzieren lassen. So kann man auch die Gestik interpretieren. Schließlich wertet ja auch ein menschlicher Gesprächspartner neben der gesprochenen Sprache Gestik oder Tonfall aus.

Und wie funktioniert die Gestik-Erkennung im Auto?

Bengler: Ein Stereo-Kamerasystem, gekoppelt an eine Infrarotbeleuchtung, zeichnet Handbewegungen auf, analysiert sie und ordnet sie verschiedenen Standardgesten automatisch zu. Insgesamt werden 17 verschiedene Gesten unterschieden. Dazu gehören sowohl einfache, intuitive Bewegungen wie ein Wischen nach links oder rechts zum Wechseln der aktuellen Radiosender, als auch komplexere Gesten zur Bedienung des Navigationssystems.

Für die Gesten des Kopfes wertet eine einzelne Kameraeinheit Farb- und Forminformationen aus. Die Farbe der menschlichen Haut ist ein gutes Differenzierungsmerkmal, da sie auch bei dunklen Hauttypen eindeutig identifizierbar ist. So lässt sich der Kopf eindeutig lokalisieren, um so die Kopfgesten erkennen zu können. Beide Erkennungssysteme beruhen auf einem Verfahren, das beispielsweise die durchschnittliche Gestendauer, Symmetrieeigenschaften und Ruhephasen zu Beginn und Ende der Gesten eines Fahrers speichert und mit statistischen Normwerten abgleicht.
Die Erkennung dynamischer Hand- und Kopfgesten bietet in bestimmten Situationen eine Alternative zur klassischen Interaktion beispielsweise per Knopfdruck. Sie eignet sich vor allem in Umgebungen mit einem hohen Geräuschpegel, in denen Spracheingabesysteme mit Erkennungsproblemen zu kämpfen haben.
Der Einsatz dynamischer Kopfgesten als zusätzliche Eingabemöglichkeit beschränkt sich weitestgehend auf das Erkennen von Kopfschütteln und Nicken, um Ablehnung und Zustimmung zu vermitteln. Auf diese Weise kann der Fahrer beispielsweise einen eingehenden Telefonanruf durch ein einfaches Nicken annehmen.

Heißt das, wenn der Fahrer gestenreich mit Mitfahrern kommuniziert oder Hintergrundgeräusche zu laut sind, ist die Kommunikation mit der Maschine nicht mehr fehlerfrei möglich?

Bengler: Wenn Hintergrundgeräusche zu laut sind, wird Spracherkennung schwieriger. Deshalb forschen wir ja an mehreren Erkennungsmögliochkeiten, damit das Fahrzeug Befehle eindeutig verstehen kann. Durch gestenreiche Kommunikation passiert nichts – der Fahrer muss schon mit eindeutigen Gesten eindeutige Befehle geben.

Autos sollen künftig auf die Stimmungen der Fahrer reagieren und beispielsweise automatisch den Radiosender wechseln. Wie lassen sich derart sensible Fahrzeuge technisch realisieren?

Bengler: Unsere Philosophie ist ganz klar – der Fahrer bleibt immer in der Verantwortung und behält stets die Kontrolle. Das Fahrzeug wird nichts tun, was der Fahrer nicht will. Generell soll der Radiosender also nicht ohne explizite Aktion des Fahrers gewechselt werden. Das System zur Erkennung von Emotionen wird nur aktiv, wenn die Spracheingabe des Fahrers nicht eindeutig ist. Widersprechen sich eine eindeutige Spracheingabe und Gesten- oder Kopfauswertung, so wird der Spracheingabe “geglaubt”.

Welche Erwartungen knüpfen Sie an eine zentrale Intelligenz, die nicht nur die elektronischen Systeme wie ABS überwacht, sondern auch den Fahrer unterstützt und von ihm lernt?

Bengler: Generell unterscheiden wir zwischen regelnden Systemen wie ABS, die direkt mit dem Fahren zusammenhängen, und den geschilderten Informations- und Kommunikationsfunktionen. Sinnvoll ist ein lernendes System nur dann, wenn es dem Fahrer in regelmäßig auftauchenden Fällen entgegenkommt, beispielsweise bei häufig gewählten Telefonnummern oder wiederholt gehörten Sendern, eventuell abhängig von der Fahrsituation. Hier wollen wir noch die Treffsicherheit erhöhen. Firewalls und Verschlüsselungstechniken schützen die Anwender vor Eingriffen von außen.

Wann werden Autos Ihrer Meinung nach so weit sein, dass sie miteinander kommunizieren und auf diese Weise Staus oder Unfälle vermeiden können?

Bengler: Unsere Forschungsfahrzeuge kommunizieren heute schon über W-LAN miteinander und tauschen sowohl Verkehrsinformationen als auch Warnhinweise aus. Bis man diese “sprechenden Fahrzeuge” auf der Straße sehen kann, sind allerdings mehr als nur technische Probleme zu lösen. Benötigt werden unter anderem einheitliche Standards. Die BMW Group arbeitet dafür im so genannten “Car2Car Communication Consortium” zusammen mit anderen europäischen Automobilherstellern an einer Standardisierung. Idealziel ist es natürlich langfristig, dass alle Fahrzeuge miteinander kommunizieren können. Bis jedoch die Standards und ein dafür notwendiges, eigenes Frequenzband, verfügbar sind, werden sicher noch einige Jahre vergehen.

Leave a Reply