„Brücke an Computer” – die Anweisung des Kommandanten der USS Enterprise, James T. Kirk. Kirk befahl, der Rechenknecht gehorchte. Und der knuffige Roboter HAL aus dem Science-fiction-Klassiker „2001 – Odyssee im Weltall” las die Befehle seines Herrn und Gebieters sogar von dessen Lippen ab. Ganz so weit ist die Technik zwar noch nicht, aber Unternehmen wie IBM, Philips oder die belgische Sprachtechnologie-Firma Lernout & Hauspie haben die Spracherkennungssysteme in der letzten Zeit immer weiter verfeinert. Ob im Haushalt, beim Autofahren, Telefonieren oder am Computer – oft reicht schon ein Wort, um Geräte die gewünschte Aktion ausführen zu lassen.
Sehr verbreitet ist die Technologie der Spracherkennung am Telefon. Wer hat sich nicht schon durch die komplizierte Menüstruktur von Service-Nummern gequält, indem er laut und deutlich Zahlen in den Hörer diktierte – oft unter den befremdeten Blicken seiner Mitmenschen? Das gibt es zwar immer noch, doch mehr und mehr setzt sich die Erkennung „richtiger” Wörter durch. Die Deutsche Bahn hat zum Beispiel unter der gebührenpflichtigen Nummer 01805|996622 das Dialogsystem „Oscar” eingerichtet. Oscar gibt dem Anrufer Informationen über den aktuellen Fahrplan. Nach einer kurzen Einführung kann der Reisewillige dem System Daten wie Abfahrtsbahnhof, Ziel und Datum mitteilen. Der Dialog klappt verblüffend gut, mögliche Verbindungen werden korrekt angesagt. Überfordert zeigt sich Oscar allerdings bei undeutlicher Sprache oder gar breitem Dialekt. Mit ähnlichen Problemen hat auch das Staumelder-Telefon von IBM (06221|593129) zu kämpfen. Ganz neue Wege gehen Mannesmann Arcor und die Burda-Tochter Cyberlab seit einigen Monaten mit ihrem Projekt Talkingweb. Unter 01805|9998255 kann man per Spracheingabe im Internet surfen. Das Audio-on-Demand-System erlaubt es, aus zahlreichen Menüpunkten wie Nachrichten, Sport, Wetter oder Börse auszuwählen. Außerdem liest Talkingweb eingegangene E-Mails vor.
Die Hamburger Software-Schmiede Kiwilogic geht beim Thema Internet und Spracherkennung noch einen Schritt weiter. Firmengründer Karl-Ludwig von Wendt: „Ich bin überzeugt, daß 2003 jede Website in der Lage sein wird, in natürlicher Sprache mit den Nutzern in Kontakt zu treten.” Dazu hat das Unternehmen „ Twipsy” entwickelt – einen sogenannten Lingubot. Der virtuelle Roboter kann Wortkombinationen aus einer Frage mit einer Datenbank abgleichen und darauf antworten. Twipsy erkennt immerhin 5000 Kombinationen. Im elektronischen Handel, dem E-Commerce, könnten Lingubots potentielle Kunden, die sich im Daten-Dschungel verirrt haben, zu gewünschten Webseiten führen. Ein weiteres wichtiges Einsatzgebiet für Spracherkennungsprogramme sind Handys und Palmtops. Sowohl Mobiltelefone als auch die Westentaschen-Computer werden immer kleiner. Gleichzeitig bieten sie einen kaum übersehbaren Funktionsumfang: Organizer, Notiz-, Adreß- und Telefonbuch, Fax, E-Mail, Internetzugang, Taschenrechner, Uhr und vieles mehr. Das Tippen auf den winzigen Tasten entwickelt sich dabei oft zu einem hoffnungslosen Unterfangen. Was liegt näher, als die kleinen Helfer mit Sprachbefehlen zu steuern? IBM zum Beispiel hat einen tastaturlosen Organizer vorgestellt, der 500 Wörter erkennt und zusätzlich mit einem Text- to-Speech-Modul ausgestattet ist. Der Mini-Computer kann E-Mails, Nachrichten oder Datenbankeinträge vorlesen sowie längere Diktate aufzeichnen, die dann an einen PC übergeben werden können.
Auch Philips setzt voll auf Spracherkennung. Die Telefone der neuesten Handy-Generation des Unternehmens sind mit Voice-Dial (Sprachwahl) und Voice-Command (Sprachbefehlen) ausgestattet. Das erspart die lästige und mühsame Tipperei.
Tippen ist out – Sprechen ist in. Das gilt ganz besonders für die Arbeit am Computer. Schon seit einiger Zeit gibt es Programme, mit denen man dem PC Texte diktieren kann. Allerdings kam es dabei am Anfang manchmal zu skurrilen Mißverständnissen: „ Vielen Dank für Ihre Milz” statt „Vielen Dank für Ihre Mails” oder die zur „Prügelfrau” mutierte „Bügelfrau” gaben zwar Anlaß zum Schmunzeln – auf Dauer wurde einem der Spaß am Diktieren aber verleidet. Mittlerweile sind PCs aber verständiger geworden.
Die Einsatzmöglichkeiten von Spracherkennung sind schier unbegrenzt. So hat das Fraunhofer-Institut für Mikroelektronische Schaltungen und Systeme zusammen mit IBM und Miele eine Waschmaschine entwickelt, der man ganz einfach sagt, ob man Bunt- oder Weißwäsche waschen will. Und es gibt Rollstühle, die mit einfachen Sprachbefehlen gesteuert werden können. Auch die Funktionen von HiFi-Geräten wie CD-Spieler, Radio oder Videorekorder werden bald auf Zuruf arbeiten.
Hans Groth




