Systeme zur automatischen Texterkennung haben den internationalen Postverkehr revolutioniert. Doch die Technologie birgt noch weit größere Potenziale: Künftige Anwendungen reichen von der Verkehrs- und Sicherheitstechnik bis zu Lesehilfen für sehbehinderte Menschen.
Zeichenerkennung überall: Ob es um das Verfallsdatum von Lebensmitteln geht oder um Autokennzeichen bei der Citymaut – viele Systeme profitieren von einer automatischen Schrifterkennung. So hilft das Sicore-System bei der Identifizierung von Rasern ebenso wie bei der Erhöhung der Sicherheit in Tunnelbereichen.
Was haben Briefträger und Apotheker gemeinsam? Sie verfügen oft über wahrhaft kryptologische Fähigkeiten, um auch die schlimmste Sauklaue zu entziffern. Doch inzwischen gibt es auch Maschinen, die automatisch unterschiedlichste Schriftzeichen erkennen können – dank erstaunlicher Lernprozesse.
Die dahinter stehende Technik heißt „Optical Character Recognition“, kurz OCR. „Auf dem Gebiet der Adresserkennung sind wir Weltmarktführer“, sagt Siemens-Produktmanager Peter Schindler stolz. Die Leistung ist hier nicht das Lesen maschinengeschriebener Texte, das kann heute jeder Scanner, sondern die Entzifferung von Handschriften. In fast jeder zweiten Briefsortieranlage rund um den Globus ist OCR-Technik von Siemens implementiert, schätzt Schindler. Der Weltmarkt umfasst derzeit etwa eine Milliarde US-Dollar, und die Siemens-Division Mobility, wo diese Anlagen hergestellt werden, hat daran einen Marktanteil von 35 Prozent.
Ein besonderes Augenmerk der Entwickler gilt dabei der stetigen Verbesserung der Leserate. „Gegenwärtig sind wir mit unserer neuesten Produktlinie ARTread in der Lage, 90 bis 95 Prozent der handgeschriebenen Anschriften zu lesen“, verdeutlicht Matthias Schulte-Austum, technischer Verantwortlicher für das Team der Bildvorverarbeitung und Objekterkennung bei Siemens Mobility in Konstanz. Eine weitere Herausforderung ist die Identifizierung aller relevanten Informationen auf einer Postsendung. Die automatische Erkennung von Nachsendeaufträgen anhand der Adresse oder von handschriftlichen Vermerken seitens des Zustellers gehört ebenso dazu wie die Erfassung der korrekten Frankierung. Aber auch die Identifizierung von Vorausverfügungen – etwa ob bei einem Umzug des Adressaten der Brief an den Absender zurückgeschickt werden soll – ist Aufgabe der Postautomatisierung. Ziel ist es, den gesamten Prozess immer weiter zu automatisieren. Schulte-Austum: „Wir wollen alle für die Sendung relevanten Informationen automatisch extrahieren, um den manuellen Aufwand so gering wie möglich zu halten.“
Insbesondere in Russland, Indien, China und den arabischen Ländern gibt es noch große Entwicklungspotenziale. „Wir haben Algorithmen entwickelt, um Schriften aller Art zu lesen – das können auch russische, chinesische oder arabische Zeichen sein“, erklärt Ingolf Rauh, Experte im Innovationszentrum in Konstanz. „Unlängst haben wir sogar einen Wettbewerb im Lesen arabischer Handschriften gewonnen.“ Die Herausforderung habe darin bestanden, tunesische Ortsbezeichnungen fehlerfrei zu identifizieren.
Letztlich basiert das Prinzip der maschinellen Zeichenerkennung immer auf den gleichen Regeln. Als besonders effizient hat sich eine Methode erwiesen, bei der die Systeme darauf trainiert werden, tausende von handgeschriebenen Ziffern oder Buchstaben aus unterschiedlichen Quellen zu vergleichen und diese im Zuge eines Lernprozesses eindeutig zu klassifizieren. „Wir erkannten schnell, wie vielseitig einsetzbar ein solches Verfahren ist. Deshalb beschlossen wir, die Möglichkeiten der OCR-Technik universell auszuloten und völlig neue Märkte zu erschließen“, erklärt Rauh.
Rasend scannen. Technisch herausragend sind auch die Sicore-Systeme von Siemens, die automatisch die Nummernschilder von Autos erkennen. Dahinter verbergen sich intelligente Kamerasysteme, die in der Regel an Straßen und Autobahnen aufgebaut sind und über eine entsprechende Bildverarbeitungs-Software verfügen. Systeme dieser Art werden etwa in Großbritannien eingesetzt, wo Städte wie London eine Citymaut eingeführt haben. Mit Kameras werden an den Einfallstraßen die Autos automatisch erfasst, und mithilfe einer zentralen Datenbank wird überprüft, ob diese für die Mautabbuchung angemeldet sind.
Eine andere Anwendung ist die Abschnittsgeschwindigkeitskontrolle mithilfe automatischer Kameras, die die Autokennzeichen erfassen. Im Gegensatz zu Radarpistolen wird dabei die Durchschnittsgeschwindigkeit über einen größeren Abschnitt bestimmt. Auf diese Weise lässt sich etwa ermitteln, ob ein Fahrer einen längeren Tunnel zu rasch durchquert hat. „Auf Basis unserer Kameratechnologie haben wir mit Siemens ITS in Großbritannien ein System namens Safezone entwickelt, das erstmals derartige Kontrollen in Innenstädten erlaubt“, erläutert Stephan von der Nüll, verantwortlich für die Entwicklung neuer Produkte und Technologien bei Siemens in Konstanz. Dieses System befinde sich unmittelbar vor der Markteinführung.
Gefahrgut im Tunnel. In der Evaluierungsphase ist derzeit noch eine Erweiterung des Systems, die im Rahmen eines Projektes des deutschen Forschungsministeriums gefördert wird: Dabei geht es darum, Gefahrgutschilder – etwa auf Lkw – zu identifizieren. Das sind orangefarbene Tafeln, die zwei Nummern enthalten. Die erste gibt die Gefahrstoffklasse an, die zweite dient der Identifizierung des Gefahrstoffs. „Die automatische Erkennung dieser Tafeln soll die Sicherheit in Tunnel- und Brückenbereichen erhöhen“, erklärt Stephan von der Nüll.
So soll das System zum Beispiel eine automatische Tunnelsperre auslösen, falls einem mit Wasserstoff beladenen LKW in kurzem Abstand ein Transporter mit Sauerstoff folgt. Auch ließe sich bei einem Unfall im Tunnel schnell ermitteln, ob ein Lkw mit Gefahrgut hinein gefahren ist.
Vermutlich wird es künftig kaum einen Bereich geben, der nicht auf die erweiterte OCR-Technik zurückgreifen kann. Die automatische Erkennung des Verfallsdatums auf Lebensmittelverpackungen oder Arzneimitteln gehört ebenso dazu wie die Identifizierung von Produktions- oder Seriennummern auf Platinen für die Elektronikindustrie. Auch Blinde könnten profitieren: So könnten OCR-Systeme beliebige Texte vorlesen, sei es bei Briefen, Büchern oder Lebensmittel-Etiketten im Supermarkt.