Zum Hauptinhalt springen

Audio-Video-Lokalisierung

Von Stimmen und Stimmungen: Wir geben Audio- und Video-Projekten eine Sprache

Audio-Video-Lokalisierung wird überall benötigt, zum Beispiel für Filme, Serien, E-Learning und Schulungsvideos, für Computerspiele, Werbung oder Social Media. Egal, ob ihr Untertitel, Audiodeskription oder Videolokalisierung benötigt – wir haben schon viele Kunden unterstützt und haben auch für euch die passenden Lösungen, auch mit AI.


Was machen wir genau für dich im Bereich Audio und Video?

Die meisten Kundinnen und Kunden brauchen unsere Unterstützung bei Audiotranskription, Audioaufnahmen, Videolokalisierung inklusive Lokalisierung von On-Screen-Text sowie Untertitelung von Videos. Auch komplette E-Learnings lokalisieren wir gerne end-to-end für dich. Gerade bei der Untertitelung und bei Audio-Projekten ist AI heutzutage sehr hilfreich. Und welche Textsorten liefern uns die Kunden? Ganz verschiedene. Oft handelt es sich um Präsentationen, Trainingsvideos, Marketingfilme, aber auch Informationsvideos.

Hier zwei schöne Beispiele für mehrsprachige Untertitel, die wir übernehmen durften. Zum Beispiel bei dem über eine halbe Million Mal gesehenen und tausendfach gelikten Werbespot für Graubünden. Auch durften wir den emotionalen Dokumentarfilm «Die fehlende Lunge» für Swisstransplant mit hochdeutschen, englischen, französischen und italienischen Untertiteln versehen. Klicke hier für den Trailer mit hochdeutschen Untertiteln.

Im Bereich Untertitel ist auch das sogenannte Spotting wichtig. Kunden fragen uns oft, wie das abläuft und was sie erwarten können. Spotting und humane Transkription werden heutzutage im Zusammenspiel von Mensch und Maschine ausgeführt. Die Bearbeitung passiert dabei in Tools, die sowohl das Video anzeigen als auch Raum für die Textkorrektur geben.

Los geht es mit der KI, die sehr präzise Timecodes sowie die übersetzte Rohfassung des gesprochenen Textes erstellt. Dann kommt der humane Part: Unsere Sprachprofis vergleichen den Textentwurf ganz genau mit dem Video. Zunächst stellen sie sicher, dass die Inhalte korrekt transkribiert wurden und die Übersetzung richtig ist. Dann prüfen sie, ob die Inhalte gut lesbar sind, ob sie im richtigen Moment und lange genug auf dem Bildschirm erscheinen. Oft muss der Text gekürzt werden. Das passiert, wenn die Personen im Video so schnell sprechen, dass man in der Zeit nicht die komplette Ausformulierung mitlesen kann, oder auch wenn es grundsätzlich mehr Text gibt, als man lesen könnte.

Hier braucht es echte Profis, denn es erfordert Fingerspitzengefühl, eine Aussage so zu komprimieren, dass die Bedeutung vollständig erhalten bleibt. Wir nutzen hier für dich also die beste Kombi aus künstlicher und menschlicher Intelligenz – für schnellere, effiziente Resultate bei Top-Qualität.

Übrigens: Audio-Video-Lokalisierung stellt auch ein wichtiges Mittel zur Inklusion hör- und sehgeschädigter Menschen dar. Falls du hierbei Unterstützung oder Beratung benötigst, wende dich gerne an uns. Bei Untertiteln für Hörgeschädigte werden zum Beispiel zusätzlich Hintergrundgeräusche verschriftlicht.

Welche Tools kommen für die Audio-Video-Lokalisierung zum Einsatz?

Wir wählen unsere Programme immer genau nach deinen Bedürfnissen aus. Zielgruppe, Timing, Tonfall, Bild-Text-Abstimmung und technische Umsetzung – all das haben wir für dich im Blick. Hier sind einige der Tools:

  • Für Audio nutzen wir je nach Bedarf: Audacity, Ardour, ocenaudio, Adobe Audition, Adobe Sensei, Avid Pro Tools, Logic Pro, Descript, Sonix
  • Für Video-Lokalisierung sind es unter anderem: Adobe After Effects, Adobe Premiere, Final Cut Pro, Filmora
  • Und für AI-Voices lohnen sich zum Beispiel: Amazon Polly, Resemble, Lobo, ElevenLabs, Murf AI

Expertin

Hast du Fragen zur Audio-Video-Lokalisierung?

Hast du ein Audio- oder Video-Projekt, vielleicht auch mit vielen verschiedenen Sprachen? Bist du nicht ganz sicher, wie du starten sollst oder welche Lösung für dich die beste ist? Melde dich gerne bei uns, Céline Rodriguez Barbur, Leiterin Projektmanagement, berät dich jederzeit gerne.

beratung@diction.ch
+41 81 750 53 33

Was sind die Vor- und Nachteile von AI bei der Audiolokalisierung?

Der Einsatz von künstlicher Intelligenz macht auch bei der Audio-Video-Lokalisierung vieles einfacher, aber nicht alles. Überlege dir am besten, welche Punkte dir wichtig sind.

Vorteile von AI-Einsatz bei der Audio-Video-Lokalisierung:

  • Lieferzeiten sind wesentlich kürzer
  • Kosten sind niedriger
  • Schnelle Anpassung sind möglich, falls Aufnahmen sich ändern

Allerdings: Je höher die Qualität sein soll, desto kostenintensiver wird auch AI. Zudem sind bestimmte Sprachen sowie komplexe Texte für die AI auch noch schwierig zu verarbeiten.

Vorteile einer Audio-Video-Lokalisierung mit und von Menschen:

  • Bei Audio sind natürliche Stimmen angenehmer, da sie die geforderte Tonalität besser darstellen
  • Regionale Aussprachen werden wesentlich besser getroffen
  • Variationen können ganz einfach ad hoc erstellt werden – bei AI bräuchte es wieder spezifische Prompts

Allerdings: Die Qualität ist ganz klar ein Plus, doch die Lieferzeiten und Kosten sind höher als bei AI-Einsatz; Aktualisierungen und Korrekturen nehmen mehr Zeit in Anspruch.

Wer prüft, ob das Audio durch AI richtig gemacht wurde und gut klingt?

Wir führen für dich eine sorgfältige Stimmenauswahl und akribische Qualitätschecks durch, und zwar mit (definitiv) menschlichen Profis.

  • Die Stimmenauswahl für AI beinhaltet zum Beispiel auch einen Testprozess, bei dem die Aussprache von schwierigen Wörtern geprüft wird
  • Beim Qualitätscheck prüfen wir Aussprache und Intonation, auch mit einem Vergleich zwischen den verschiedenen Sprachen
  • Zusätzlich wird alles noch einmal von (bisher nicht in den Prozess involvierten) Linguist:innen überprüft, die Feedback geben

Wenn du dir unsicher bist, was zu deinem Audio-Projekt passt, sprich uns einfach an. Wir beraten dich ehrlich dazu – manchmal lohnt sich AI viel mehr, manchmal bringt es keine Zeit- und Kostenersparnis.