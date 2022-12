Es ist Zeit, einer wichtigen Frage auf den Grund zu gehen: Wer kann bessere Dienste verrichten – Mensch oder Maschine. Im Folgenden werden nicht alle betroffenen Bereiche des alltäglichen Lebens besprochen, sondern lediglich ein kleiner Ausschnitt: Die Übersetzungsbranche. Genau genommen der Teil, welcher bewegtes Bild übersetzt und synchronisiert. Um es vorweg zu nehmen: Es hat erstaunliche Unterschiede gegeben.

Von Christian Schultze

Zu Beginn stand die Wahl des Videos. Zum Vergleich wurde ein Videoausschnitt eines Filmes aus den 50er Jahren mit dem Titel „Flucht in die Zukunft – In die Welt der Kunststoffe“ genommen. Aufgabe war, diesen in sechs Sprachen (DEU, FRZ, ES, IT, PT, UKR) zu übersetzen und zu vertonen, die Originalvertonung sollte nicht hörbar sein, die Originalatmosphäre hingegen schon. Es sollte weibliche und männliche Speaker geben und Untertitel sollten inklusive sein.

Ernüchterndes Ergebnis bei Agenturen, welche Bearbeitungen manuell vornehmen

Der Vergleich begann mit der Kontaktaufnahme von gestandenen Agenturen, welche den als Kernkompetenz Dubbing mit Vertonungen und Übersetzungen von Menschenhand aufweisen. Google wies auf drei Premiumagenturen hin. Pioneer Film GmbH aus Deutschland, Hispano Language Advisory aus Argentinien und ITC Translations aus Nordamerika.

Es gibt diverse andere Anbieter, aber einem allgemeinen Vergleich sollte diese Auswahl ansatzweise standhalten. Alle Agenturen wurden per Mail über die Anfrage informiert. ICT meldete sich schnell mit einem Angebot über 5’622 USD ohne dass ein Zeitrahmen definiert wurde. Hispano Language Advisory antwortete etwas verzögert mit dem Hinweis, dass man die Originalsounds und die Vertonung nicht trennen können und sie die Audiofiles unsererseits benötigten. Ein Preis wurde nicht definiert. Pioneer Film sagte hingegen ab, da der Aufwand sich für den kurzen Film nicht lohne. Zusammenfassend lässt sich sagen, dass einmal der Preis sehr hoch erscheint, dass einmal die ursprünglichen Audiofiles unsererseits nicht zur Verfügung standen und einmal eine Absage.

Mit dem ernüchternden Ergebnis, war es Zeit sich der automatisierten Seite zu widmen. Unter denselben Voraussetzungen wurden die Anbieter mit der Aufgabe konfrontiert: Rev, Verbit, Papercup, Maestra und Vidby.

Rev bot überraschenderweise gar keine Vertonung, sondern nur Transkription an. Der Anbieter fiel demnach gleich aus dem Wettbewerb. Bei Verbit und Papercup wird Vertonung hingegen angeboten. Die Anmeldung funktioniert bei beiden Anbietern allerdings nur für Unternehmen, nicht Privatpersonen. Die Antwort von Papercup lautete: „Vielen Dank. Wir werden uns mit Ihnen in Verbindung setzen“, was allerdings nie geschah. Verbit teilte mit, dass die Bestellung zu gering für sie war.

Zwei gute Alternativen bei Anbietern mit automatisiertem Video-Dubbing

Bei Maestra wurde es schon interessanter. Die Registrierung ging schnell, in der Testversion konnten man das File kostenlos hochladen, den Text transkribieren, in eine Sprache übersetzen und das Ergebnis runterladen, obwohl sich die Seite hin und wieder aufhängte. Die Übersetzung in jede Sprache dauerte ca. 3 bis 7 Minuten. Allerdings musste man den Schauspielern verschiedene Stimmen selbst zu weisen, was einer vollautomatischen Lösung widerspricht. Der Preis war überzeugend. Insgesamt kostete die komplette Übersetzung sechs USD, es wurde männliche und weibliche Stimmen angeboten.

Es ist auch möglich zu wählen, ob die Originalsprache und deren Lautstärke beibehalten werden soll. Aber Maestra kam nicht mit der Aufgabe zurecht, „die Originalsprache herauszuschneiden (so dass das Original nicht zu hören war) und gleichzeitig die Hintergrundmusik beizubehalten“. Untertitel in Form einer srt-Dartei wurde mitgeliefert.

Bei Vidby war die Anmeldung ähnlich unkompliziert. Es gab auch gute Support-Optionen via Messenger und Live Demo Angebot. Die Seite war übersichtlich. Man konnte einfach alle Sprachen auswählen und man konnte verschiedene Preisvarianten wählen. Sehr günstig war die vollautomatische Variante, die eine Genauigkeit von bis zu 80% (Preis 31,50 USD), dann die teurere 99%-Variante (Preis 60,67 USD, 24h Delivery), bei welcher ein Editor das Transkript bearbeitet. Dies kann man auf Wunsch auch selbst tun und senkt den Preis auf 31,50 USD.

Insgesamt brauchte es ca. 5 Minuten, um eine Bestellung abzuschliessen. Der Zeitrahmen vom Zeitpunkt der Zahlung bis zum Erhalt des Transkripts zur Bestätigung (optional) betrug 8 Stunden. Nach der Bestätigung des Transkripts dauerte es 10 Minuten, um das Video in 6 Sprachen zu vertonen.

Vidby hat es zudem geschafft, die Originalsprache herauszuschneiden und die Hintergrundgeräusche zu behalten.

Maestra und vidby haben durch die einfache Handhabung überzeugt. Wie steht es mit der Übersetzungsqualität?

In der Endfassung der ukrainischen Videoübersetzung und -synchronisation von vidby haben wir acht Ungenauigkeiten gefunden (das sind 575% weniger im Vergleich zu den Fehlern in der ukrainischen Übersetzung in Maestra). Ausserdem wurden sechs Wörter mit falschen Akzenten aufgezeichnet. Wie sich herausstellte, konnte dies optional in der Phase der Auftragsbildung korrigiert werden. Wir haben die deutsche Übersetzung mit Hilfe von Spezialisten der Lingoking-Plattform bewertet, die 61 Korrekturen gezählt haben (das sind 275% weniger im Vergleich zu Maestras Deutsch-Übersetzungsergebnis).

Bereits hohe Qualität bei Video Dubbing mit Unterstützung von künstlicher Intelligenz

Zusammenfassend lässt sich sagen, dass die menschlichen Übersetzungsangebote für den alltäglichen Gebrauch kaum nutzbar waren. Sie waren kostenintensiv, umständlich und langsam. Bei der automatisierten Variante, hoben sich die Anbieter vidby und Maestra hervor, wobei vidby bei der Qualität und Auswahlmöglichkeiten die Nase vorn hatte.

Dubbing via KI wird in Zukunft seinen Weg machen, da die Systeme schon heute eine erstaunliche Qualität haben. In wenigen Jahren wird diese Qualität kaum zu toppen sein. Selbst die Simultanübersetzung scheint nicht mehr weit entfernt. Bei der Übersetzung von Videos muss sich der Mensch eingestehen, dass das, was er selbst geschaffen hat, ihn wohl oder übel in den Schatten stellt.

Detaillierter Bericht zum Herunterladen (PDF):

Vidby