Das mitdenkende Auto – Fahrzeug-Kommunikation
Mein Auto versteht mich
Das Auto verwandelt sich zunehmend in ein Smart Car. Dabei zählt künftig weniger die Motorleistung, sondern vor allem, wie intelligent das Auto mit Informationen umgeht. Ein virtueller Beifahrer wird mit dem Fahrer sprechen, ihn vor Gefahren im Verkehr warnen oder seine Lieblingsmusik im Internet suchen. Siemens verschmilzt hierfür Information und Kommunikation zum Infotainment.
Informationsvielfalt im Auto: Verschiedene Medien wie Navigationssystem, Radio, CD?Spieler oderauch die Anbindung ans Internet werden künftig vernetzt – und vom Fahrer auch per Sprache bedient
Der Fahrer eines Smart Cars der Zukunft setzt sich morgens in sein Auto und wird von seinem persönlichen virtuellen Beifahrer im Cockpit-Display begrüßt. Dieser Avatar, eine Art elektronischer Dienstbote, fragt den Fahrer nach dem Ziel und ob er den Radiosender, der beim Morgenkaffee lief, auch im Auto einstellen soll. Er erinnert den Fahrer an seine Termine und auch daran, die Alarmanlage des Hauses einzuschalten. "Dieses Szenario geht weit über das hinaus, was wir heute im Auto mit dem Infotainment-System machen", sagt Dr. Hans-Gerd Krekels. "Wir haben derzeit viele einzelne Geräte-Module wie Radio, CD-Player, DVD-Wechsler, MP3-Player oder auch das Navigationssystem im Auto. Deshalb müssen wir genau wissen, welche Information sich auf welchem Gerät befindet", erklärt der Leiter des Produkt- und Innovationsmanagements für Infotainment Solutions bei Siemens VDO Automotive in Wetzlar. Diese Geräteorientierung werde sich aber künftig verändern, hin zu Content-based-Multimedia. Das heißt, der Nutzer muss sich nicht mehr darum kümmern, wo sich die Informationen befinden. Sie werden ihm durch ein Suchsystem auf Wunsch geliefert: Aus dem Kofferraum, wo DVDs oder CD-Stapel lagern, aus dem Internet über Wireless LAN (WLAN) oder über Telefonnetze wie GSM oder UMTS.
"Künftig werden wir Fahrzeuge haben, die nicht nur Benzin, sondern auch Informationen tanken", ergänzt Dr. Abdelkarim Belhoula, Vorentwickler und verantwortlich für Telematik (siehe "Digitale Verkehrsmanager") und Fahrerassistenzsysteme. Während der Fahrer zur Tankstelle fährt, loggt sich das Fahrzeug gleichzeitig in den dortigen Server – etwa über WLAN – ein. Als Payback-Kunde könnte der Fahrer Vergünstigungen wie einen kostenlosen Musikdownload bekommen. Oder an Ortseinfahrten überspielen Funk-Hotspots vorbeifahrenden Autos auf Wunsch Verkehrs- oder Veranstaltungsdaten ins Infotainment-System. Mit der gleichen Technik könnte man auch Kontakt zu seinem Heim aufnehmen. Vorausgesetzt, es ist ein Smart Home – wie das T-Com-Haus in Berlin (siehe "T-Com-Haus") – dann könnte es sich über Funk mit dem Auto vernetzen und Informationen über Hausfunktionen wie Licht, Heizung oder Alarmanlage übermitteln. Auch andere Webservices sind denkbar, wie das Anfang 2005 von Siemens vorgestellte Buddy-Tracking. Wer etwa im Urlaub seine Freunde verloren hat, kann sich beim Freundefinder anmelden und nach ihnen suchen. Auf dem Kartendisplay des Navigationssystems werden dann die Standorte der gesuchten Personen angezeigt. Voraussetzung ist eine Mobilfunkverbindung wie UMTS, die ständig online geschaltet ist. Serienreif soll die Anwendung in rund fünf Jahren sein.
Achtung, ich rutsche! Zu Belhoulas Vision kontaktfreudiger Fahrzeuge gehört auch die Kommunikation zwischen Autos, mit der die Verkehrssicherheit erhöht werden soll. Auf der Abschlusspräsentation des vom Bundesforschungsministeriums geförderten Projekts Invent demonstrierte Siemens im Frühjahr 2005, wie Autos sicherheitswichtige Daten über Funk austauschen, um dadurch Unfälle zu vermeiden: Auf einem Münchner Testgelände wurde ein Fahrzeug auf nasser Fahrbahn ins Rutschen gebracht. Die Limousine übermittelte eine Warnung samt genauem Standort über den Funkstandard GSM an ein – in diesem Fall imaginäres – nachfolgendes Fahrzeug. Dessen Fahrer hätte dann bremsen oder ausweichen können. Sollten künftig Autos ständig online sein, könnte eine solche Verbindung auch direkt erfolgen – etwa über WLAN. Doch was bei der Internetanbindung privater PC funktioniert, macht bei fahrenden Autos Probleme, da die WLAN-Technik ursprünglich nicht für den mobilen Einsatz entwickelt wurde. "Wir forschen an einer mobilen WLAN-Technik, mit der Daten zuverlässig auch zwischen Fahrzeugen bei hohen Geschwindigkeiten ausgetauscht werden können", sagt Belhoula.
Künftiges Kommunikationsszenario: Fahrzeuge vernetzen sich untereinander und tauschen Informationen über die Verkehrslage aus
Entscheidend ist dabei, dass die Kommunikation den Fahrer nicht überfordern oder ablenken darf. Bei Siemens machen sich Designer und Ergonomen Gedanken, wie der Fahrer mit den Informations- und Anzeigesystemen am effektivsten umgehen kann. Die Sprache als natürliches Kommunikationsmittel wird dabei immer bedeutender. Schon heute lassen sich mit einfachen Kommandos Klimaanlage oder Radio bedienen. Auch Sender oder Musiktitel kann der Fahrer durch direktes Ansprechen finden. Künftig werden Sprachsysteme so intelligent sein, dass die Suche selbst bei unvollständigen Anfragen wie "nächster Titel von Robbie Williams" erfolgreich ist.
Der Weg zum virtuellen Beifahrer ist vorgezeichnet. Bei Corporate Technology (CT) in München realisieren Sprachexperten wie Gerhard Hoffmann und sein Team die neue Generation von Spracherkennung: Very Smart Recognizer (VSR) heißt ihre Lösung. Zwar konnten Computersysteme im Labor bereits vor 20 Jahren etwa 5 000 Wörter verarbeiten, wozu aber ein großer Prozessrechner nötig war. Im Auto wurden dagegen aus Platz-, Robustheits- und Kostengründen zunächst nur Minirechner eingesetzt, die vor zwei bis drei Jahren etwa 500 Wörter erkennen konnten.
"Obwohl auch heute die Rechenleistung der Bordcomputer noch etwa zehnfach kleiner ist als bei vergleichsweise modernen PC, haben wir durch Verbesserungen der Technologie erreicht, dass ein solches System bis zu 75 000 Wörter versteht", sagt Hoffmann über sein derzeitiges Labormodell. Ab Ende 2006 soll bereits eine daraus abgeleitete Serienversion mit 30 000 Wörtern auf die Straßen kommen, und künftig sollen sogar über 100 000 Wörter vom VSR verstanden werden. Nicht nur bei einzelnen Wörtern, sondern auch bei flüssig gesprochenen Sätzen wird es Steigerungsraten von heute 2 000 auf über 50 000 Wörter geben – und das in verschiedenen Sprachen.
Verbindung mit Zuhause: Das Bordsystem kann künftig drahtlos mit der Steuerung des Hauses kommunizieren
Sprachliche Trickkiste.Auch robuster soll die Spracherkennung werden, denn das Auto ist dafür ein schwieriger Ort. In ruhigen Umgebungen erkennt Hoffmanns VSR die eingegebenen Wörter fast hundertprozentig. Doch im Auto dröhnt der Motor und der Wind braust. Wird zusätzlich ein Fenster geöffnet, hat selbst der Mensch Schwierigkeiten, seinen Partner zu verstehen. Trotzdem zeigt sich hier der VSR bereits sehr robust gegenüber Störgeräuschen und markiert damit einen Bestwert in seiner Klasse. Erreicht wird dies durch clevere Rauschunterdrückungs-Verfahren und die so genannte Echo-Unterdrückung, die bekannte Schallquellen wie etwa die Signale der Audioanlage herausfiltert. Dadurch kann dann das Navigationsgerät auch bei laufendem Radio problemlos bedient werden.
Damit die Erkennungsrate noch weiter steigt, greifen Forscher von Siemens Corporate Research (SCR) in Princeton im US-Staat New Jersey tief in die Trickkiste. Sie arbeiten an speziellen Techniken, Störgeräusche in der Spracherkennung auszublenden – und erzielen damit hervorragende Ergebnisse. Als besonders geeignet haben sich so genannte Array-Mikrofone erwiesen, mit denen die Erkennungsraten deutlich nach oben klettern. Array-Mikrofone enthalten zwei, vier oder acht kleine Mikrofone, die beispielsweise im Innenrückspiegel eingebaut sind. Spricht der Fahrer, erreicht das Schallsignal die einzelnen Mikrofone unterschiedlich schnell – trotz ihres geringen Abstands. Aus der Berechnung der Schall-Laufzeiten weiß das Array-Mikrofon, aus welcher Richtung die Sprache kommt und dämpft Signale aus anderen Richtungen.
Ein ganz neues System zur Unterstützung der Erkennung untersuchen die CT-Forscher mit der Technologie des Lippenlesens. Sie verwenden dazu eine kleine Videokamera, die das Gesicht des Fahrers beobachtet. Das System sucht im Videobild nach den Lippen, wobei eine zusätzliche Farbklassifikation über die Hautfarbe die Lokalisierung erleichtert. Aus der Lippenbewegung wird dann auf den Inhalt der Sprache geschlossen. "Damit sind wir noch in einem frühen Stadium, aber auch ganz weit vorne dran", erläutert Hoffmann. "Wir werden damit die Geräuschrobustheit unseres Erkenners besonders im Cabrio, das für einen Spracherkenner die schwierigste Umgebung ist, verbessern können."
Ein komplexes Sprachmodul für das Auto von morgen muss aber auch selbst sprechen können. Das Navigationssystem sagt ja dem Fahrer bereits, wo es hingehen soll. Künftig kann das Infotainment-System auch Textnachrichten (SMS) oder e-Mails und Texte aus dem Internet vorlesen, damit der Fahrer die Information erhält, sich aber trotzdem auf den Verkehr konzentrieren kann. Mit dem System Papageno sind die Siemens-Forscher dabei, ein geeignetes, sehr kompaktes Sprachsynthese-System zu entwickeln. Zuerst wandelt das Programm geschriebene Wörter in Phoneme um. Dann ergründet es die Art des Satzes – zum Beispiel ob ein Fragesatz oder nur eine kurze Äußerung vorliegt – und damit, welche Satzmelodie (Prosodie) zu verwenden ist. Auf Basis dieser Erkenntnisse werden passende Sprachschnipsel aus einem akustischen Inventar gesucht, modifiziert und zu einem Sprachsignal zusammengesetzt.
Software zum Lippenlesen: Mit Hilfe einer Videokamera erkennt das System aus den Mundbewegungen des Fahrers die Laute. Geplantes Einsatzgebiet sind Cabriolets
Im Dialog mit Diane. "Für kleine Plattformen haben wir ein solches System schon realisiert – die Sprachqualität ist damit etwa für Mobiltelefone vollkommen ausreichend", sagt Dr. Michael Lützeler, zuständig für die Produktumsetzung des Systems bei CT. Aber die Qualität der Stimme soll bald hohen Ansprüchen genügen und immer natürlicher werden: "Wir müssen uns bei der optimalen Bereitstellung der Sprachbausteine und der Prosodie verbessern." Dazu setzt Lützeler – wie seine Kollegen von der Spracherkennung – auf die im Vergleich zu Handys höhere Rechenleistung und Speicherkapazität bei Bordsystemen im Auto.
Richtig natürlich wird sich der Fahrer in Zukunft mit dem virtuellen Beifahrer unterhalten können, wenn Spracherkennung und Sprachsynthese über Dialogkomponenten verbunden werden. So können dann auch komplizierte Anfragen – etwa nach besonderen Reisezielen oder nach Hilfe bei der Bedienung – in gewohnter Weise geäußert werden. "Wo finde ich bei diesem Auto den Tankdeckel?", "Zeig mir den Weg zur nächsten billigen Tankstelle" – viele dieser Fragen kann das System dann verstehen und anhand seiner bordeigenen Informationen oder über einen Zugriff auf das Internet beantworten. CT setzt hierzu auf die Dialogmaschine Diane, die schon erfolgreich im Telefoniebereich – etwa bei Anrufbeantwortern – eingesetzt wird.
Doch Siemens traut dem sprachverstehenden Auto noch mehr zu: Beispielsweise könnte die Sprecher-Erkennung – heute schon als Zugangskontrolle für Telefonie-Anwendungen verwendet – auch im Auto genutzt werden und feststellen, ob unberechtigte Personen das System bedienen. Durch eine Landessprachenerkennung würde sich das System automatisch auf die Sprache des Benutzers einstellen – etwa wenn dieser im Ausland einen entsprechend ausgerüsteten Leihwagen nutzt. Und der Dialogstil kann sich vielleicht sogar an das aus dem Sprachsignal abgeleitete Alter des Fahrers anpassen und zwischen "cool" und "distinguiert" wechseln. Auf diese Weise könnte Krekels virtueller Beifahrer bald wie ein echter auftreten.
Rolf Sterbak