Das Thema der Datensicherheit in Translation-Memorys wird für viele Unternehmen, die Übersetzungen in Auftrag geben, immer wichtiger. Hierbei geht es in erster Linie die Sicherheit und Anonymisierung von personenbezogenen Daten.

Personenbezogene Daten (PBD) sind nicht nur in materieller, sondern auch in ideeller Hinsicht ein wertvolles Gut, das als besonders schützenswert gilt und deswegen einer Sonderbehandlung gegenüber anderen Daten unterliegt. Die Schweiz hat die Wichtigkeit von personenbezogenen Daten mit der Annahme der Revision des Datenschutzgesetzes (DSG) im September 2020 unterstrichen. Die grosse Frage für (Sprach-)Dienstleister und Unternehmen gleichermassen ist: wie in Zukunft mit dem Thema umgehen? Datenschutz an sich ist natürlich (fast) überall längst die Norm, aber der Schutz von PBD nahm bisher nicht unbedingt eine Sonderstellung ein.

Anonymisierung von Personendaten: Warum und wie?

In jedem Unternehmen gibt es beim Schutz personenbezogener Daten andere Dinge zu berücksichtigen. Wenn Sie häufig Übersetzungen erledigen oder in Auftrag geben, befinden sich potenziell PBD in Ihren Translation-Memorys (TMs). TMs sind Übersetzungsspeicher, die jeder Übersetzer nutzt, um im Interesse des Kunden schneller, effektiver und korrekter zu arbeiten. Und natürlich, wie der Begriff schon sagt: Es werden Daten gespeichert, in denen sich potenziell auch PBD befinden, also Personennamen, Adressen, Telefonnummern usw..

Gemäss Datenschutzverordnung müssen Sie in der Lage sein, diese PBD auf Nachfrage

a) lückenlos ermitteln zu können

b) vollständig exportieren zu können und

c) löschen zu können.

Daher stellt sich vielen Unternehme die Frage: Wie geht man in Zukunft bei neuen Übersetzungen vor? Und fast noch wichtiger: Was passiert mit den Daten, die sich bereits angesammelt haben? Bei Übersetzungen geht es meist darum, dass personenbezogene Daten im Text oder in den Translation-Memorys gefunden und anonymisiert/pseudonymisiert werden sollen. Theoretisch könnte aber auch der Fall auftreten, dass ehemalige Mitarbeitende von Ihnen aus den Metadaten als Bearbeiter oder Autoren gelöscht werden möchten. Dazu unten mehr.

Welche Lösungen gibt es?

Für das Auffinden der Daten und deren Anonymisierung/Löschung gibt es manuelle und technische Lösungen, jeweils mit klaren Vor- und Nachteilen. Je nachdem, ob Sie zum Beispiel bestehende (grosse) TMs rückwirkend anonymisieren oder vor dem Start einer Übersetzung den Schutz der PBD sicherstellen möchten. Beiden Ansätzen gemeinsam ist, dass sie gute Optionen bieten, aber nicht zu 100 % sicherstellen können, dass es keine sensiblen Daten mehr im TM gibt.

Manueller Ansatz

Das Plus: Ohne initiale Anschaffungskosten können Sie direkt mit der Anonymisierung der Daten beginnen. Der Ansatz lohnt sich weniger für grosse bestehende Translation-Memorys, da er dann sehr zeitaufwendig wird, kann aber ein guter und unkomplizierter Einstieg in das Anonymisieren von neuen Aufträgen und damit für einen künftigen sauberen TM-Bestand sein.

Wie funktionierts? Bereits bevor die Texte an den Sprachdienstleister geschickt werden, entfernen Sie manuell die betreffenden Daten und ersetzen sie durch Platzhalter. Für eine saubere Übersetzung insbesondere bei Sprachen mit starkem Geschlechterbezug wie Französisch oder Italienisch sollten die Platzhalter einen Indikator geben, ob es sich um eine männliche oder weibliche Person handelt, damit die Übersetzung grammatikalisch korrekt ist und bei der Rückeinsetzung der eigentlichen Daten keine unschönen Bilder mit falscher Ansprache oder Grammatik entstehen. Eine gute Möglichkeit ist, mit Pseudonymisierung statt Anonymisierung zu arbeiten und weibliche Namen durch generisch weibliche sowie männliche Namen durch generisch männlich zu ersetzen.

Das rückwirkende Vorgehen bei bestehenden Translation-Memorys funktioniert analog, kann jedoch je nach Anzahl der Einträge sehr viel Zeit veranschlagen – denn TMs enthalten schnell mal mehrere (zehn-)tausend Einträge.

Wie bei allen manuellen Vorgehensweisen ist das Ergebnis immer nur so gut wie die Aufmerksamkeit und Genauigkeit der Personen, die die Anonymisierung vornehmen. Zudem sind hier auf Ihrer Seite natürlich Sprachkenntnisse nötig, falls Sie Texte oder TMs in Fremdsprachen durchforsten müssen.

Technologischer Ansatz

Der Vorteil: Mit dem technischen Ansatz können Sie sowohl die PBD aus grossen Bestands-TMs entfernen als auch dafür sorgen, dass diese Daten überhaupt nicht erst zu Ihrem Dienstleister und damit zu Ihrem Übersetzer gelangen. Der Nachteil: Bisher gibt es keine hundertprozentig genaue technische Lösung. Je nach Sprache können Sie mit Ergebnissen von zwischen 89 und 98 Prozent korrekter Anonymisierung rechnen.

Wie funktionierts? Das Tool muss erst einmal erkennen, welche Daten im Text überhaupt personenbezogen sind und deswegen anonymisiert werden müssen. Für neue Übersetzungsaufträge lassen sich definierte Daten gut anonymisieren – solange diese bekannt sind. Namen (mit Hilfe von Listen), Telefonnummern, E-Mail-Adressen können dem Tool einfach beigebracht werden. Schwieriger wird es zum Beispiel bei Geburtsdaten, die für das Programm oft nicht ohne Weiteres von «harmlosen» Daten unterscheidbar sind.

Ebenso wie beim manuellen Ansatz, ist es wichtig, dass die Übersetzerin weiss, ob es sich bei der unkenntlich gemachten Person um einen Mann oder eine Frau handelt, vor allem bei Sprachen, in denen man sich nicht optimal genderneutral ausdrücken kann. Auch hier bietet die Pseudonymisierung («Frau Mustermann») eine wirksame Lösung.

Es gibt verschiedene Tools und Services, aber hier finden Sie beispielsweise ein Tool, das Sie mit Trados Studio einsetzen können. Falls Sie einen Anonymisierungsservice nutzen möchten, gibt es unter anderem hier oder hier Angebote.

Weitere Tools? Neben der Anonymisierung von personenbezogenen Daten innerhalb von Texten geht es, wie oben angedeutet, manchmal auch um die Anonymisierung von Metadaten, die an verschiedenen Stellen (TM-Daten, zweisprachige XLIFF-Dateien, Termbankeinträge) gespeichert werden und bei der Weitergabe der Daten berücksichtigt werden sollten: Wer war der Autor? Welche Person hat einen bestimmten Satz übersetzt? Auch hier gibt es technologische Lösungen wie beispielsweise jene für Trados Studio.

Grosses EU-Projekt

Übrigens werden momentan auch im Rahmen des EU-Projektes MAPA (Multilingual Anonymisation for Public Administrations) alle technischen Möglichkeiten abgeklopft. Schliesslich hat die EU riesige Legacy-Korpora, in denen sich auch personenbezogene Daten befinden. Wer eine Demo von MAPA ausprobieren möchte, kann dies hier tun. Wir haben es mal ausprobiert mit Personennamen und Telefonnummer:

Damit EU-Daten als genau genug anonymisiert angesehen werden, sollen technische Raten oberhalb von 95 % erreicht werden. Wir hoffen, dass diese Zahlen toolgestützt bis Jahresende 2021 für alle 24 EU-Sprachen erreicht werden: Damit wäre ein grosser Schritt getan, den Schutz von PBD mit einem effizienten Übersetzungsprozess zu vereinen. Da diese MAPA-Lösung als Open Source zugänglich ist, wird sie auch vielen Unternehmen bei der Datensicherheit in Translation-Memorys gute Hilfestellung geben.

Datensicherheit in Translation-Memorys: Wie weiter?

Eine One-size-fits-All-Herangehensweise gibt es leider nicht. Sämtliche Ansätze und alle Tools haben Vor- und Nachteile. Einige gute Lösungen sind dabei, sich im Markt zu etablieren, andere zeichnen sich gerade am Horizont ab (insbesondere MAPA, das EU-Projekt). In allen Fällen bleibt jeweils ein Restrisiko.

Falls Ihnen die Anonymisierung von personenbezogenen Daten in Ihren TMs Kopfzerbrechen bereitet, sprechen Sie mit uns. Wir haben uns mit Datensicherheit in Translation-Memorys bereits intensiv beschäftigt und helfen Ihnen gerne, einen für Sie passenden Ansatz zu wählen.

Deborah Palm, Key-Account-Managerin Finance und Legal

Das könnte Sie auch interessieren

Datensicherheit in Translation-Memorys

Das Thema der Datensicherheit in Translation-Memorys wird für viele Unternehmen, die Übersetzungen in Auftrag geben, immer wichtiger. Hierbei geht es in erster Linie die Sicherheit und Anonymisierung von personenbezogenen Daten. Personenbezogene Daten (PBD) sind nicht nur in materieller, sondern auch in ideeller Hinsicht ein wertvolles Gut, das als besonders schützenswert gilt und deswegen einer Sonderbehandlung…

Weiterlesen

10 Tipps: Tippfehler und Rechtschreibfehler vermeiden

Ja, Rechtschreibfehler vermeiden oder ausmerzen, wie schafft man das am besten? Flüchtigkeits- oder Unwissenheitsfehler passieren uns allen. Aber peinlich oder ärgerlich können sie trotzdem werden – wenn die Chefin im Brief noch Buchstabendreher findet oder wenn ein Kunde uns auf ein doppeltes Wort im Newsletter aufmerksam macht. Was sind typische Fehler? Um Fehler zu vermeiden,…

Weiterlesen

Supply-Chain-Management im Markt der Sprachdienstleister

Im Magazin Nr. 7 gibt es spannendes Interview mit dem Diction-CEO Patrick Fassbender zum Thema Supply-Chain-Management, Prozessautomatisierung und vieles mehr in der Übersetzungsbranche Lesen Sie hier den Artikel noch einmal als Blog. Kettenreaktionen: Supply-Chain-Management, Automatisierung, rasante Märkte, neue Technologien? Kommt man da als Übersetzungsagentur eigentlich noch mit? Sind wir nicht einfach Kreativwesen, die Bleistift kauend aus dem…

Weiterlesen