Künstliche Intelligenz und Generative Large Language Models wie ChatGPT sind in aller Munde. Wir möchten in diesem Artikel die Fragen aufgreifen: Kann künstliche Intelligenz dolmetschen? Wann ist die KI besser als Dolmetscher*innen? Wann sind Dolmetscher*innen besser als künstliche Intelligenz.
Wir fassen kurz zusammen, wie die KI Sprache erkennt, übersetzt und testen eine App als Konsekutivdolmetscher.
Künstliche Intelligenz teilt den Text in Wörter (Tokenisierung). Dann werden die Tokens grammatisch klassifiziert oder auch als Eigenname identifiziert. Als nächstes wird die grammatische Struktur eines Satzes analysiert. Das wird als Dependency Parsing bezeichnet. Zusammengenommen wird so die natürliche Sprachverarbeitung (Natural Language Processing) nachgeahmt.
Durch ein großes Modell, also Trainingsmaterial, kennt die KI viele Sprachen. Es handelt sich hierbei um Sprachen, die im Internet genutzt werden. Es gibt aber auch spannende Projekte mit online kaum verbreiteten Sprachen. Die korrespondierenden Wörter werden nun entsprechend ihrer grammatischen Funktionen für den Zielsatz arrangiert. Dabei werden die Satzbauregeln der Zielsprache angewandt.
Wir testen Übersetzer auf dem IPhone. Hier eine kurze deutsche Begrüßung:
Begrüßung-Deutsch
0:00
0:22
Bei kurzen, langsamen Sätzen und bei klarer Aussprache und disziplinierter Mikrofon-Nutzung macht die Anwendung einen guten Job:
AI-English-translation
0:00
0:29
Als Dolmetscher*innen unterscheiden wir zwischen they und you und gehen auch nicht davon aus, dass Sie Babys sondern Badges mitgenommen haben.
Fazit: Ein einfaches Gespräch kann die künstliche Intelligenz dolmetschen. Allerdings konsekutiv und natürlich müssen alle direkt in das Mikrofon des Smartphones sprechen.
Bei sehr schnellen, abgelesenen Texten nutzen Dolmetscher*innen Strategien, wie das Weglassen von Doppelungen oder die Nutzung von Oberbegriffen, um eine Aufzählung zusammenzufassen. Die KI gibt den gesamten Text wieder. Bedenken Sie, dass das Lesende an ihre Grenzen bringen kann. Auch die Rechenleistung einer KI spielt eine Rolle. Es kann Verzögerungen bei der Verarbeitung geben und dann werden 10 Sätze am Stück gesendet. Im Gegensatz zu unseren Dolmetscher*innen denkt die KI nicht an ihr Zielpublikum und, wie man das Hörerlebnis so angenehm wie möglich gestalten kann.
Mehrere Videokonferenzplattformen wie Teams, Zoom oder Webex bieten Lösungen an, bei denen die gesprochene Sprache transkribiert und Teilnehmenden individuell übersetzte Untertitel (Closed Captions) angezeigt werden. Andere Anbieter testen Lösungen, bei denen der Text auch von einer Computerstimme gelesen wird.
Die Fehlerquellen sind auch hier Spracherkennung und Übersetzung. Niemand kontrolliert die Übersetzung. Im Gegensatz zum Menschen lässt die KI etwas Unnverständliches nicht weg, sondern produziert (fabuliert) irgendetwas.
Die Entwicklungen im Bereich der künstlichen Intelligenz sind rasant. Zum gegenwärtigen Zeitpunkt gibt es aber zahlreiche Bereiche, in denen unsere Dolmetscher*innen der KI überlegen sind.
Stellen Sie sich eine Trauerfeier vor. Hier haben auch die Dolmetscher*innen eine angemessene Betroffenheit in ihrer Stimme und wahren Pausen an den richtigen Stellen.
Oft gibt es mehrere Lösungen, um einen Ausdruck in eine andere Sprache zu übertragen. Bei einem Symposium erzählten Teilnehmende, welchen Vorurteilen sie sich gegenüber sehen. Eine Person sagte: „They look at me and they see a big man.“ Eine KI verfährt mathematisch und wählt die häufigsten Übersetzung aus: „… und sehen einen großen Mann.“ Als Dolmetscher*innen ziehen wir die ganze Veranstaltung heran und sehen die Person. Die Dolmetscherin sagt: „Sie sehen mich an und sie sehen meinen Körperumfang.“
Die wenigsten Menschen sprechen druckreif. Alle begehen grammatische Verstöße oder brechen schon einmal einen Satz ab und formulieren neu. Das menschliche Gehirn mit seiner natürlichen Sprachverarbeitung stört sich die meiste Zeit nicht daran, sondern korrigiert die kleinen Fehler. Das machen wir auch beim Dolmetschen. Die KI hingegen zieht als Kontext nur den Satz an sich heran. Sagt eine Rednerin: „Wir drohen, über das Ziel hinaus zu laufen.“ wird daraus: „We threaten to overshoot the mark.“
Auch wenn professionelle Dolmetscher*innen durch ihr Studium und jahrelange Praxis nicht ständig überlegen, „wie sage ich das auf Englisch?“, passen sie auf, was ihren Mund verlässt. Haben Sie unser Hörbeispiel angehört? Eine Dolmetscherin hätte entweder erkannt, dass die Rednerin im Deutschen „Badge“ sagt und das korrekt ins Englische gedolmetscht oder beschlossen, dass die Beschreibung „vor der Tür“ reicht, um Kaffee und Snacks in der Pause zu finden.
Des Weiteren dolmetschen wir in der Praxis zu zweit. Wir wechseln uns ab, da zum einen die Konzentrationsanforderung hoch ist. Zum anderen hört die sogenannte Co-Kabine zu und schreitet bei Fehlern ein.
Da die künstliche Intelligenz Rechenleistung benötigt, muss alles, was gesagt wird, durch Computer laufen. Sollte dies für Ihr Präsenztreffen nicht vorgesehen sein – und der technische Aufbau ist umfangreich – sind Sie mit Dolmetscher*innen aus Fleisch und Blut gut beraten.
Wie bereits beschrieben, tun sich einige Programme schwer mit dem spontanen Erkennen der gesprochenen Sprache. Sollten also mehrere, unterschiedliche Sprachen genutzt werden, ist dies ebenfalls eine Herausforderung für die Maschine.
Apropos Maschine: Die Programme werden besser, weil maschinelles Lernen genutzt wird. Das heißt, dass alles, was Sie in eine Anwendung hineinsprechen, langfristig für das kontinuierliche Lernen der KI genutzt wird. Hier gilt zu überlegen, wie vertraulich Ihre Gespräche sind.
Sie suchen eine zuhörer-orientierte, vielsprachige und vertrauliche Lösung? Schicken Sie uns gerne Ihre Anfrage per Mail oder über unser Kontaktformular. Wir stellen für Sie ein exzellentes Team zusammen und organisieren auch die Dolmetsch-Technik.