Internet – Semantisches Web
Das Netz denkt mit
Persönliche Agenten, individuell angepasste Informationen wie Reiserouten, Smalltalk mit Computerstimmen ... um all dies zu leisten, muss sich die Struktur des Internets ändern – hin zu einem semantischen Web, das Internetseiten mit Bedeutungen versieht
"Guten Morgen, Frau Brown – wohin soll die Reise diesmal gehen?" "Nach Athen und zwar am Dienstag", antwortet Cynthia Brown. "Gerne", sagt die freundliche Stimme im Hörer, "ich suche Ihnen sofort einen Flug heraus. Aber bitte planen Sie mehr Zeit ein, da in Athen gerade die Bus- und Taxifahrer streiken." Cynthia ist dankbar für den Hinweis – und überrascht: So viel Schläue hätte sie dem automatischen Buchungssystem gar nicht zugetraut.
Das Gespräch zwischen Frau Brown und dem automatischen Sprachdialogsystem ist frei erfunden – doch Science-fiction ist es nicht. An Portalen, die Sprache verstehen und ausgeben, den Nutzer erkennen und unaufgefordert Zusatzinformationen liefern, arbeiten Forscher weltweit mit Hochdruck. Einer von ihnen ist Dr. Hans-Ulrich Block. Der gelernte Linguist von der Abteilung Interaktions-Technologien bei Siemens Corporate Technology (CT) in München hat mit Dr. Dietrich Klakow vom Philips-Forschungslabor unter dem Akronym SInDia ein Konzept entwickelt, das innerhalb von vier Jahren zu einem Superinformierten Dialogsystem führen soll.
Damit soll das lästige Out-of-Domain-Problem heutiger Dialogsysteme geknackt werden. Die kennen zwar im Idealfall alle Flüge nach Athen, versagen aber, wenn der Anrufer die Domäne Flugauskunft verlässt und noch ein Hotel buchen oder nach streikenden Taxifahrern fragen möchte. Ziel des SInDia-Konzepts ist auch ein Small-talk-Manager, der aktiv in lockerem Plauderton interessante Informationen in einen Dialog einstreut – etwa die Wettervorhersage oder Veranstaltungstipps für Athen. Am Anfang werden sich die Anwendungen wohl auf vordefinierte Bedeutungsbeziehungen wie Städte/Wetter oder Auto/Mietwagentarife beschränken. "Das muss nicht immer bierernst sein", findet Block, "es soll ruhig auch Spaß machen."
Vom technischen Anspruch her ist so ein System jedoch alles andere als spaßig. Es muss nämlich in der Lage sein, Texte, Tabellen und interaktive Dienste wie Bahnauskunft oder Preisdatenbanken im Web rasend schnell zu scannen und nach ihrer Bedeutung auszuwerten. "Bisher ist es sehr aufwändig, so etwas einfaches wie eine Bahnauskunft zu entwickeln" betont Klakow. "Wenn wir das automatisieren, können wir Dialogsystemen zum Durchbruch verhelfen und viel mehr Service bieten." Voraussetzung ist, dass der Computer weiß, was eine bestimmte Information bedeutet und in welchem Kontext sie steht, damit er sie später passend in den Dialog einbauen kann. Die Fachwelt spricht in diesem Fall vom semantischen Web – die Semantik ist die Lehre von der Bedeutung der Wörter und Sätze.
Geplant ist, in den Programmiercode von Webseiten zusätzliche Tags (Markierungen) aufzunehmen, die nicht nur heute übliche Informationen wie das Veröffentlichungsdatum eines Dokuments angeben, sondern auch die Bedeutung des Inhalts beschreiben – wenn möglich für alle Seiten des Internet. Die Bedeutungen sind in Strukturen festgelegt, die international standardisiert werden und etwa diesem Aufbau folgen: Mensch – Mann/Frau – Kind/Erwachsener und so weiter. Das würde die Kommunikation der Computer untereinander und die Arbeit von Suchmaschinen auf eine völlig neue Basis stellen. So lassen sich etwa die Geschäftsbedingungen eines OnlineShops semantisch kodieren. Ein Agent – ein kleines Software-Heinzelmännchen, das für seinen Besitzer automatisch Auskünfte einholt oder Aufträge erledigt (siehe Beiträge über Agententechnologie in Pictures of the Future, Herbst 2001) – wird dann nicht mehr nur den Listenpreis verschiedener Shops vergleichen, sondern auch weitere Kriterien wie Lieferzeit oder Garantiebedingungen berücksichtigen – je nachdem, was dem Kunden wichtig ist.
Das C-Lab hat einen PDA entworfen, der ein idealer Museumsbegleiter wäre: Was dessen Kamera sieht (links), ergänzt das System automatisch durch 3D-Zeichnungen (mitte) und weitere Erklärungen (rechts)
Das Einfügen der Tags in den Programmcode der Webseiten steckt noch in den Kinderschuhen und geschieht in der Regel von Hand – "eine Heidenarbeit, gegen die sich viele Webmaster sträuben", glaubt Hans-Ulrich Block. Dort wo bereits Datenbanken vorlägen, wie bei Bahn- oder Flugauskunft, sei diese Methode aber sinnvoll. Für neue Seiten gibt es Web-Editoren, die schon bei der Eingabe nach den Informationen für die Tags fragen. Block glaubt, dass das Taggen irgendwann automatisch geschieht. Programme zur Textanalyse – so genannte Parser – zerlegen Texte im Web in ihre grammatikalischen Bestandteile und schließen davon auf die Bedeutung der Satzglieder.
Das semantische Web ist eine wichtige Voraussetzung fürs mobile Internet, weil dort Informationen anders aufbereitet werden müssen, ihre Bedeutung aber nicht verfälscht werden darf. So wurden bisher Schriften und Bilder aus dem Internet einfach verkleinert, um sie auf einem Handy oder Personal Digital Assistant (PDA) darzustellen. Am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI, siehe Gastkommentar) versucht man dagegen, Web-Inhalte mit so genannten Ontologie-Sprachen so aufzubereiten, dass Inhalt, Struktur und Layout getrennt sind. Ein Software-Agent entscheidet dann etwa, dass auf der Mobilfunkarmbanduhr ein kurzer Text, auf dem PDA noch eine kleine Grafik und auf dem Laptop zusätzlich Fotos dargestellt werden.
Dazu hat das DFKI das System AIA (Adaptiver Internet-Agent) entwickelt, das automatisch Bilder oder Infografiken vereinfacht, umformatiert oder sprachlich beschreibt. "Die Transformation geschieht nach inhaltlichen Erfordernissen", betont DFKI-Direktor Professor Wolfgang Wahlster. Und sein Team geht noch weiter: Im Projekt REAL (Ressourcen-adaptive Lokalisation) hat es eine Anwendung für PDA entwickelt, die an Hand der Änderung von Positionsdaten und der Beobachtung des Nutzerverhaltens erkennt, welche Informationen gerade wichtig sein könnten.
Wer im heutigen Internet etwas sucht, muss im Prinzip rund eine Milliarde Webseiten mit unstrukturierten Inhalten durchforsten (links). Morgen dagegen sollen die Webseiten auch Markierungen (Tags) mit wichtigen Bedeutungselementen enthalten, die von Software-Agenten automatisch erstellt, gelesen und verstanden werden. Ontologien definieren die Sprache dieser Tags, und bestimmte Datenbanken enthalten automatisch extrahierte Verzeichnisse von Tags. Ein Such-Agent muss dann nur noch in diese Metadaten-Verzeichnisse blicken – was das Finden einer Webseite enorm beschleunigt
Cynthia Brown muss auf ihrem Flug einen Zwischenstopp in Frankfurt einlegen und schlendert durch die Ladenpassagen. Der PDA erkennt dies und zeigt ihr Informationen und Sonderangebote der Geschäfte an. Plötzlich wird sie vom letzten Aufruf für ihren Flug aufgeschreckt. Cynthia spurtet hektisch zum Gate. Auf dem PDA sind jetzt nur noch einfache Richtungspfeile zu sehen, die den Weg zum Gate weisen.
Emotionen wie Stress aber auch Informationen wie Einkaufsverhalten, Musikgeschmack oder der bevorzugte Sitzplatz im Flugzeug sollen künftig beim Surfen im Internet ausgewertet und beim Anbieter oder im PDA des Nutzers gespeichert werden. Gelangt der Kunde auf ein Internetportal oder in ein Sprachdialogsystem, wird das Angebot oder der Dialog sofort angepasst. "Nach 20 Jahren Forschung haben wir nun kommerziell einsetzbare Verfahren zur automatischen Bestimmung individueller Nutzerprofile", versichert Wahlster.
Ebenso wichtig für das mobile Internet der Zukunft ist der Aufbau einer neuen Netzstruktur. Denn trotz schneller Übertragungstechniken wie UMTS oder Wireless-LAN sind die Ressourcen im Äther knapp. Eine Methode, wie das Internet effizienter organisiert werden könnte, ist Multicast. Bisher werden Daten, die gleichzeitig von tausend Nutzern angefragt werden, tausendmal vom Server losgeschickt und sternförmig verteilt. Multicast entspricht dagegen einer Baumstruktur, bei der die Daten nur einmal versandt und unterwegs an den Knotenpunkten vervielfältigt und zu den Empfängern geschleust werden.
Eine weitere Möglichkeit sind Peer-to-Peer-Verfahren, die vor allem durch Musiktauschbörsen wie Napster bekannt wurden. Dort stammen die Daten nicht mehr von einem Server, sondern werden im Idealfall direkt unter den Nutzern ausgetauscht. "Peer-to-Peer wird zunehmen, weil die Leute nicht nur konsumieren, sondern Texte, Musik, Bilder und ihr Wissen mit anderen teilen wollen", glaubt Michael Finkenzeller von Siemens Corporate Technology in München. So entfallen im deutschen Forschungsnetz 60 % des Datenverkehrs auf Peer-to-Peer-Anwendungen.
Finkenzellers Kollege Jochen Grimminger könnte sich vorstellen, dass Kids auf dem Schulhof so genannte Ad-hoc-Netze aufbauen und Klingeltöne oder Logos direkt von Handy zu Handy austauschen, ohne den teuren Umweg übers Mobilfunknetz. Das würde das Netz an stark frequentierten Orten entlasten. Bei schlechtem Empfang könnten auch die Daten zu anderen Handys in Sichtweite weitergereicht werden, die eine günstigere Verbindung ins Netz haben. Grimminger hat sich Abrechnungsmodelle überlegt, damit in solchen Multihop-Szenarien keiner übervorteilt wird. So könnte die Nutzung von Multihop eine Gebühr kosten – wer sein Handy für andere öffnet, sammelt im Gegenzug Bonusgesprächsminuten. Damit bei Ad-hoc-Netzen auch der Netzbetreiber auf seine Kosten kommt, könnte dieser die Gebühren eintreiben, die etwa beim kostenpflichtigen Austausch von Klingeltönen anfallen.
Cynthia Brown ist mittlerweile in Athen angekommen. Mit der Digicam an ihrem PDA macht sie ein Bild vom Tempel, der über der Stadt thront. "Akropolis", steht kurz darauf auf dem Display. Das Foto wird überlagert von einem Bild, das das Gebäude darstellt, wie es vor 2000 Jahren vielleicht ausgesehen hat. Pfeile zeigen, wie Cynthia auf den Hügel gelangt.
Was für die Akropolis noch Zukunftsmusik ist, ist am C-Lab in Paderborn, wo Siemens und Uni-Wissenschaftler gemeinsam forschen, zum Teil schon Realität (Bild oben). Die Grundidee ist ein universeller Welterklärer, bei dem Bilder als Eingabe in eine Suchmaschine dienen. In Paderborn erklärt der PDA aber nicht die Welt, sondern etwa einen Backofen. Ein Hausgeräte-Hersteller möchte damit seine Produkte im Verkaufsraum angemessen präsentieren. Die Paderborner Forscher haben diese Aufgabe elegant gelöst: Richtet man die im PDA eingebaute Digicam auf den geschlossenen Ofen, so nimmt sie ein Video auf und schickt es über ein drahtloses Funknetz an einen Computer. Der analysiert das Video in Echtzeit und erzeugt nach dem Prinzip der Augmented Reality (siehe Beitrag Pumpe 23, bitte melden!) zusätzliche Bilddaten, die perspektivisch korrekt überlagert werden. Auf dem Display klappt dann zum Beispiel die Tür des Ofens auf, obwohl er im Verkaufsraum immer noch geschlossen da steht. Die Illusion ist so perfekt, dass dem Kunden das Wasser im Mund zusammen läuft: Nach wenigen Augenblicken fährt aus der abgebildeten Backröhre ein virtuelles Brathühnchen heraus.
Bernd Müller