Wenn das Wetter kalt ist, wird die Puff Unterlage sich langsam puffen*

Computer können nicht so wie Menschen übersetzen – diese Erfahrung hat sicherlich schon jeder von uns gemacht. Ob es die Speisekarte beim letzten Spanienurlaub, die Bedienungsanleitung von Niedrigpreis-Produkten aus Fernost oder der mit Google übersetzte Text war. Dennoch hat heutzutage die maschinelle Übersetzung ihre Daseinsberechtigung. Zum Beispiel, wenn es nur um die rasche Informationserschliessung geht, für die eine nicht perfekte Übersetzung reicht. Oder darum, eine Rohübersetzung anzufertigen, die dann von Menschenhand korrigiert wird. In bestimmten Einzelfällen hat die Maschine hier die Nase vorn.

Doch wie funktioniert die maschinelle Übersetzung überhaupt? Wie lernt die Maschine übersetzen? Und was müssen Sie bei den verschiedenen Ansätzen beachten?

Regelbasierte Systeme

Bei sogenannten regelbasierten Systemen erfolgt die Übersetzung aufgrund von sprachlichen Regeln: Sätze werden in einzelne Bestandteile zerlegt und durch grammatikalische Kategorien (Wortarten und Satzglieder) analysiert. Mit Hilfe von zweisprachigen Glossaren und grammatischen Regeln der Zielsprache wird dann die Übersetzung zusammengebastelt. Da dieses System sprachgebunden ist, muss für jede Sprachkombination ein eigenes Programm entwickelt werden.

Statistische Übersetzung

Die statistische Übersetzung basiert hingegen auf Wahrscheinlichkeitsrechnungen auf der Grundlage grosser Datenmengen: Wortgruppen (meist bis zu 3 Wörter) in einer Sprache werden mit möglichen Entsprechungen in der Zielsprache gleichgesetzt und mit Hilfe von sogenannten Sprachmodellen in die wahrscheinlichste Reihenfolge gebracht. Als Datenbasis dienen von Menschenhand gefertigte Übersetzungen oder eben zweisprachige Texte, die im Internet verfügbar sind – und mit denen die Maschine gefüttert wird.

Hybride maschinelle Übersetzung

Aus der Kombination dieser beiden Ansätze ergab sich die hybride maschinelle Übersetzung, bei der zum Beispiel die statistisch angefertigte Übersetzung durch sprachliche Regeln korrigiert wird. Oder umgekehrt: Der mit sprachlichen Algorithmen gewonnene Text wird anschliessend mit statistischen Verfahren nochmal verbessert.

Neuronale Übersetzung

Die neueste Entwicklung in diesem Bereich ist die neuronale Übersetzung, die sich die Erkenntnisse der Forschungen auf dem Gebiet der künstlichen Intelligenz zunutze macht. Ähnlich wie bei modernen Schachcomputern oder selbstfahrenden Autos wird hier ein mehrdimensionales Netz mit Millionen von Informationen aufgebaut. Auch in diesem Fall muss die Maschine mit grossen Textmengen gefüttert werden, auch hier ist man also auf schon vorhandene Übersetzungen angewiesen.

Der beste Ansatz?

Die Antwort ist, wie so oft, nicht ganz einfach. Auch deshalb, weil es von all diesen Arten eine ganze Reihe von Produkten und Lösungen gibt: einfache und komplexe, kostenlose und teure, für die eine oder andere Sprache oder Textsorte geeignet usw. Wie komplex der Bereich eigentlich ist, zeigt diese Wikipediaseite, die gewiss nur einen allgemeinen Überblick über den Bereich bietet und keinesfalls Anspruch auf Vollständigkeit stellen kann.

Kommt maschinelle Übersetzung für Sie in Frage?

In jedem Fall gilt es, vorab ein paar Dinge zu klären:

Wie steht es um die Vertraulichkeit der Texte? – Können die so einfach ins Browserfenster kopiert werden? Denken Sie daran: Mit Google Translate wandern die Daten praktisch ungeschützt übers Internet und werden auf bestimmten Servern gespeichert und zumindest statistisch ausgewertet – Wikileaks und Co. lassen grüssen.

Wie genau muss die Übersetzung sein? – Für den internen Gebrauch, um nur die Essenz des Textes zu verstehen, genügt unter Umständen auch ein weniger ausgefeiltes System. Doch Vorsicht: Niemand garantiert Ihnen, dass die Maschine nicht etwas drastisch «missversteht». Im folgenden Beispiel kann sich der englische Leser vielleicht die schräge Struktur des Zielsatzes im Kopf etwas zurechtbiegen – aber dass das «enterprise» nicht zur «news agency» gehört, sondern dieser etwas mitteilt, das kann er nicht mehr erraten. Aufgrund dieses signifikanten Fehlers ist die Übersetzung selbst für den anspruchslosen Leser wertlos.

Wie spezifisch ist der Text? – Geht es um die «Bedienungsanleitung einer automatischen Kunstbrutanlage»? Dann muss das System unter Umständen ganz speziell trainiert werden. Die Frage ist: mit welchem Aufwand und welchem Nutzen? Und sind überhaupt genug Daten verfügbar, um das System aufzubauen? Falls nicht, wie können diese Daten besorgt werden, mit welchem Aufwand? Lohnt sich da nicht doch eher ein menschlicher Übersetzer?

Wer betreut das System? – Welche Kompetenzen braucht es bei der Vorbereitung der Daten, und wer kann das erledigen? Wer kümmert sich dann um das «Weiterfüttern» der Maschine, und wie kann man letztendlich die Effizienz und den Nutzen der Investition bewerten?

Fazit: Maschinelle Übersetzungssysteme sind kein Tabuthema mehr, selbst für Sprachdienstleister nicht. In manchen Fällen und unter bestimmten Bedingungen kann der Computer durchaus brauchbare Ergebnisse liefern. Übersetzer, Lektoren, Terminologen und Spezialisten in Fleisch und Blut braucht es aber in jedem Fall – und sei es «nur», um einen grob/schlecht vorübersetzten Text zu korrigieren (wobei unsere Übersetzer darauf bestehen, es gehe so gut wie immer schneller, wenn sie das Ding einfach ganz neu übersetzen). Und wenn Sie mit dem Gedanken spielen, Google Ihre Internetseiten oder Ihre neueste Kundenbroschüre übersetzen zu lassen, dann lesen Sie bitte nochmal die erste Zeile ganz oben.

* Bekanntes Beispiel einer maschinell übersetzten Bedienungsanleitung für eine Luftmatratze.

Bruno Ciola, Head of Language Technology

Foto: www.daserste.de