Das Thema der Datensicherheit in Translation-Memorys wird für viele Unternehmen, die Übersetzungen in Auftrag geben, immer wichtiger. Hierbei geht es in erster Linie die Sicherheit und Anonymisierung von personenbezogenen Daten.

Personenbezogene Daten (PBD) sind nicht nur in materieller, sondern auch in ideeller Hinsicht ein wertvolles Gut, das als besonders schützenswert gilt und deswegen einer Sonderbehandlung gegenüber anderen Daten unterliegt. Die Schweiz hat die Wichtigkeit von personenbezogenen Daten mit der Annahme der Revision des Datenschutzgesetzes (DSG) im September 2020 unterstrichen. Die grosse Frage für (Sprach-)Dienstleister und Unternehmen gleichermassen ist: wie in Zukunft mit dem Thema umgehen? Datenschutz an sich ist natürlich (fast) überall längst die Norm, aber der Schutz von PBD nahm bisher nicht unbedingt eine Sonderstellung ein.

Anonymisierung von Personendaten: Warum und wie?

In jedem Unternehmen gibt es beim Schutz personenbezogener Daten andere Dinge zu berücksichtigen. Wenn Sie häufig Übersetzungen erledigen oder in Auftrag geben, befinden sich potenziell PBD in Ihren Translation-Memorys (TMs). TMs sind Übersetzungsspeicher, die jeder Übersetzer nutzt, um im Interesse des Kunden schneller, effektiver und korrekter zu arbeiten. Und natürlich, wie der Begriff schon sagt: Es werden Daten gespeichert, in denen sich potenziell auch PBD befinden, also Personennamen, Adressen, Telefonnummern usw..

Gemäss Datenschutzverordnung müssen Sie in der Lage sein, diese PBD auf Nachfrage

a) lückenlos ermitteln zu können

b) vollständig exportieren zu können und

c) löschen zu können.

Daher stellt sich vielen Unternehme die Frage: Wie geht man in Zukunft bei neuen Übersetzungen vor? Und fast noch wichtiger: Was passiert mit den Daten, die sich bereits angesammelt haben? Bei Übersetzungen geht es meist darum, dass personenbezogene Daten im Text oder in den Translation-Memorys gefunden und anonymisiert/pseudonymisiert werden sollen. Theoretisch könnte aber auch der Fall auftreten, dass ehemalige Mitarbeitende von Ihnen aus den Metadaten als Bearbeiter oder Autoren gelöscht werden möchten. Dazu unten mehr.

Welche Lösungen gibt es?

Für das Auffinden der Daten und deren Anonymisierung/Löschung gibt es manuelle und technische Lösungen, jeweils mit klaren Vor- und Nachteilen. Je nachdem, ob Sie zum Beispiel bestehende (grosse) TMs rückwirkend anonymisieren oder vor dem Start einer Übersetzung den Schutz der PBD sicherstellen möchten. Beiden Ansätzen gemeinsam ist, dass sie gute Optionen bieten, aber nicht zu 100 % sicherstellen können, dass es keine sensiblen Daten mehr im TM gibt.

Manueller Ansatz

Das Plus: Ohne initiale Anschaffungskosten können Sie direkt mit der Anonymisierung der Daten beginnen. Der Ansatz lohnt sich weniger für grosse bestehende Translation-Memorys, da er dann sehr zeitaufwendig wird, kann aber ein guter und unkomplizierter Einstieg in das Anonymisieren von neuen Aufträgen und damit für einen künftigen sauberen TM-Bestand sein.

Wie funktionierts? Bereits bevor die Texte an den Sprachdienstleister geschickt werden, entfernen Sie manuell die betreffenden Daten und ersetzen sie durch Platzhalter. Für eine saubere Übersetzung insbesondere bei Sprachen mit starkem Geschlechterbezug wie Französisch oder Italienisch sollten die Platzhalter einen Indikator geben, ob es sich um eine männliche oder weibliche Person handelt, damit die Übersetzung grammatikalisch korrekt ist und bei der Rückeinsetzung der eigentlichen Daten keine unschönen Bilder mit falscher Ansprache oder Grammatik entstehen. Eine gute Möglichkeit ist, mit Pseudonymisierung statt Anonymisierung zu arbeiten und weibliche Namen durch generisch weibliche sowie männliche Namen durch generisch männlich zu ersetzen.

Das rückwirkende Vorgehen bei bestehenden Translation-Memorys funktioniert analog, kann jedoch je nach Anzahl der Einträge sehr viel Zeit veranschlagen – denn TMs enthalten schnell mal mehrere (zehn-)tausend Einträge.

Wie bei allen manuellen Vorgehensweisen ist das Ergebnis immer nur so gut wie die Aufmerksamkeit und Genauigkeit der Personen, die die Anonymisierung vornehmen. Zudem sind hier auf Ihrer Seite natürlich Sprachkenntnisse nötig, falls Sie Texte oder TMs in Fremdsprachen durchforsten müssen.

Technologischer Ansatz

Der Vorteil: Mit dem technischen Ansatz können Sie sowohl die PBD aus grossen Bestands-TMs entfernen als auch dafür sorgen, dass diese Daten überhaupt nicht erst zu Ihrem Dienstleister und damit zu Ihrem Übersetzer gelangen. Der Nachteil: Bisher gibt es keine hundertprozentig genaue technische Lösung. Je nach Sprache können Sie mit Ergebnissen von zwischen 89 und 98 Prozent korrekter Anonymisierung rechnen.

Wie funktionierts? Das Tool muss erst einmal erkennen, welche Daten im Text überhaupt personenbezogen sind und deswegen anonymisiert werden müssen. Für neue Übersetzungsaufträge lassen sich definierte Daten gut anonymisieren – solange diese bekannt sind. Namen (mit Hilfe von Listen), Telefonnummern, E-Mail-Adressen können dem Tool einfach beigebracht werden. Schwieriger wird es zum Beispiel bei Geburtsdaten, die für das Programm oft nicht ohne Weiteres von «harmlosen» Daten unterscheidbar sind.

Ebenso wie beim manuellen Ansatz, ist es wichtig, dass die Übersetzerin weiss, ob es sich bei der unkenntlich gemachten Person um einen Mann oder eine Frau handelt, vor allem bei Sprachen, in denen man sich nicht optimal genderneutral ausdrücken kann. Auch hier bietet die Pseudonymisierung («Frau Mustermann») eine wirksame Lösung.

Es gibt verschiedene Tools und Services, aber hier finden Sie beispielsweise ein Tool, das Sie mit Trados Studio einsetzen können. Falls Sie einen Anonymisierungsservice nutzen möchten, gibt es unter anderem hier oder hier Angebote.

Weitere Tools? Neben der Anonymisierung von personenbezogenen Daten innerhalb von Texten geht es, wie oben angedeutet, manchmal auch um die Anonymisierung von Metadaten, die an verschiedenen Stellen (TM-Daten, zweisprachige XLIFF-Dateien, Termbankeinträge) gespeichert werden und bei der Weitergabe der Daten berücksichtigt werden sollten: Wer war der Autor? Welche Person hat einen bestimmten Satz übersetzt? Auch hier gibt es technologische Lösungen wie beispielsweise jene für Trados Studio.

Grosses EU-Projekt

Übrigens werden momentan auch im Rahmen des EU-Projektes MAPA (Multilingual Anonymisation for Public Administrations) alle technischen Möglichkeiten abgeklopft. Schliesslich hat die EU riesige Legacy-Korpora, in denen sich auch personenbezogene Daten befinden. Wer eine Demo von MAPA ausprobieren möchte, kann dies hier tun. Wir haben es mal ausprobiert mit Personennamen und Telefonnummer:

Damit EU-Daten als genau genug anonymisiert angesehen werden, sollen technische Raten oberhalb von 95 % erreicht werden. Wir hoffen, dass diese Zahlen toolgestützt bis Jahresende 2021 für alle 24 EU-Sprachen erreicht werden: Damit wäre ein grosser Schritt getan, den Schutz von PBD mit einem effizienten Übersetzungsprozess zu vereinen. Da diese MAPA-Lösung als Open Source zugänglich ist, wird sie auch vielen Unternehmen bei der Datensicherheit in Translation-Memorys gute Hilfestellung geben.

Datensicherheit in Translation-Memorys: Wie weiter?

Eine One-size-fits-All-Herangehensweise gibt es leider nicht. Sämtliche Ansätze und alle Tools haben Vor- und Nachteile. Einige gute Lösungen sind dabei, sich im Markt zu etablieren, andere zeichnen sich gerade am Horizont ab (insbesondere MAPA, das EU-Projekt). In allen Fällen bleibt jeweils ein Restrisiko.

Falls Ihnen die Anonymisierung von personenbezogenen Daten in Ihren TMs Kopfzerbrechen bereitet, sprechen Sie mit uns. Wir haben uns mit Datensicherheit in Translation-Memorys bereits intensiv beschäftigt und helfen Ihnen gerne, einen für Sie passenden Ansatz zu wählen.

Deborah Palm, Key-Account-Managerin Finance und Legal

Das könnte Sie auch interessieren

Genderneutrale Sprache: Wie geht das?

Viele Menschen, Unternehmen und Organisationen möchten sich inklusiver ausdrücken, um zu zeigen, dass sie jede Person, egal, wie diese sich identifiziert, mit ihren Texten ansprechen und willkommen heissen. Daher ist genderneutrale Sprache nicht unbedingt das gleiche wie geschlechtergerechte Sprache, sondern betont idealerweise weder die weibliche noch die männliche Form. Geschlechtergerechte Sprache nutzt häufig Gendersternchen, Schrägstriche,…

Weiterlesen

Gendern auf Französisch: Ein Ziel, viele Wege

Wer meint, Gendern auf Deutsch wäre kompliziert, sollte unbedingt diesen Beitrag lesen. 😊 Beim Gendern auf Französisch gibt es nämlich auch sehr viele Möglichkeiten. Als Übersetzerin beschäftige ich mich erst seit einigen Jahren intensiv mit diesem Thema. Denn lange Zeit war das generische Maskulinum die Regel, und die weibliche Form wurde – wenn es nicht…

Weiterlesen

German gender: it’s complicated

There are certain aspects of German that really make me appreciate the simplicity of English grammar whenever I have to grapple with them. Cases, for example, are a never-ending nightmare for me, but that’s an issue for another day. One of the big difficulties I have with German as a native speaker of English is…

Weiterlesen