Datenschutzrechtliche Ausgestaltung der automatischen Transkription von Audiodateien
I. Ausgangslage / Kurzdarstellung des Unternehmens
Wir sind die dr. dresing & pehl GmbH, Deutschhausstraße 22A, 35037 Marburg, und vertreiben unter der Marke „audiotranskription“ seit 2005 Software sowie als optionale Ergänzung hierzzu Fußschalter zur manuellen Transkription von Interviews. Die Software ist hauptsächlich im Hochschulkontext im Einsatz und ist dort zentraler Bestandteil der qualitativen Methodenausbildung.
Im Folgenden beschreiben wir unsere vertraglichen und technischen Maßnahmen, um die automatische Spracherkennung datenschutzkonform zu gestalten.
II. Wichtige Begriffe
Für das bessere Verständnis zwei zentrale Begriffe, die wir Unterscheiden:
- Vertragsdaten: Ihre persönlichen Informationen wie Name und Adresse. Alles, was wir für Bestellung, Zahlung und Bereitstellung benötigen.
- Auftragsdaten: Ihre Audio- und Textdateien sowie die daraus erstellten Transkripte. Diese Daten enthalten je meist persönliche Daten auch Dritter Personen (der Interviewpartner)
Wir nehmen den Datenschutz ernst und halten uns an die Datenschutz-Grundverordnung (DSGVO).
Sie werden vor bzw. beim Anlegen eines Kundenkontos ausführlich gemäß Art. 13 DSGVO über die Datenverarbeitung informiert, dort ist auch ein prominenter Link zur Datenschutzerklärung. DIese ist auch direkt hier zu finden.
IV. Überblick über die automatische Transkription
Über die Software f4 oder einen Web-Client können Interviews oder andere Sprachdateien zu unserem Server hochladen werden. Dort werden die Sprachdateien automatisiert in einen Text überführt.
Nach der Umwandlung kannst Du den erzeugten Text direkt herunterladen und bearbeiten. Die Daten sind dann wieder nur auf Deinem eigenen Rechner. Um Deine Daten zu schützen, löschen wir alle Informationen von unserem Server, sobald die Transkription abgeschlossen und an Dich übermittelt wurde.
Wie genau das alles abläuft? Das erklären wir hier Schritt für Schritt in den folgenden Abschnitten.
1. Softwareinstallation/Registrierung
Um unseren Service nutzen zu können, brauchst Du entweder f4 auf Deinem Rechner oder unseren Web-Client. Zum Start ist eine persönliche Registrierung erforderlich:
Der Registrieren-Button führt dich durch den Registrierungsprozess. In beiden Fällen sind nur wenige Schritte nötig:
Schritt 1: Nutzerkonto erstellen
Für die Erstellung Deines Kontos benötigst Du lediglich Deine E-Mail-Adresse und ein sicheres Passwort. (eine Kombination aus Groß-/Kleinschreibung, Sonderzeichen, Zahlen, mind. 10 Zeichen).
Falls Du Dein Passwort einmal vergessen solltest, kannst Du es jederzeit zurücksetzen. Dafür senden wir Dir einen Sicherheitscode an Deine hinterlegte E-Mail-Adresse.
Im Anmeldeformular bitten wir Dich auch, unserer Datenschutzerklärung zuzustimmen. Du findest sie über einen bereitgestellten Link direkt im Formular oder direkt hier.
Schritt 2: Bestätigung der Anmeldung
Nach der Anmeldung erhältst Du eine E-Mail mit einem Bestätigungscode. Gib diesen Code in der Software ein, um Dein Konto zu aktivieren.
Bitte beachte: Aus Sicherheitsgründen müssen wir Deine Daten löschen, wenn Du den Code nicht innerhalb von 24 Stunden eingibst.
Schritt 3: Abschluss eines Vertrags über die Auftragsverarbeitung (AVV)
Im nächsten Schritt präsentieren wir Dir den Vertrag zur Auftragsverarbeitung (AVV). Dieser Vertrag ist essentiell für alle, die Daten von Dritten verarbeiten, also z.B. Interviews auswerten möchten. Der Vertrag ist laut DSGVO nötig.
Hierin wird ausführlich dokumentiert, wie wir technisch und organisatorisch den Datenschutz sicherstellen.
Damit alles DSGVO konform läuft gibst du hier den genauen Zweck der Datenverarbeitung und die Art der zu verarbeitenden personenbezogenen Daten anzugeben. Nach Deiner Zustimmung senden wir Dir den Vertrag per E-Mail zu. Damit ist der Vertragsschluss gemäß Art. 28 Abs. 9 DSGVO erfolgt und Falls dein Projekt einmal von Datenschutzbeauftragten geprüft wird kannst du so nachweisen, dass du die rechtlichen Voraussetzungen erfüllst.
Mit Abschluss dieser Schritte ist Deine Registrierung vollständig, und Du kannst mit der Nutzung unseres automatischen Transkriptionsdienstes beginnen.
Schritt 3a (optional): Verpflichtung auf die Geheimhaltung nach Maßgabe von § 203 StGB
Für Berufsgruppen mit besonderen Geheimhaltungspflichten (z.B. im juristischen oder medizinischen Bereich) bieten wir auf Wunsch eine zusätzliche Geheimhaltungsvereinbarung an. Diese stellt die Einhaltung gesetzlicher Anforderungen sicher.
2. Freischaltung für den Upload von Auftragsdaten
Nach Abschluss der Registrierung ist der Account für den Upload von Audiodateien auf unseren Server freigeschaltet. Deine Registrierungsdaten speichern wir sicher auf unserem Spracherkennungsserver. Diese Informationen werden strikt von Deinen Abrechnungsdaten im Shop getrennt aufbewahrt – sowohl physisch als auch in der Datenstruktur. Mehr Details zur technischen Umsetzung findest Du im Abschnitt “Infrastruktur zur Datenverarbeitung” unter Punkt VII.
3. Kauf von Zeitkontingenten über den Onlineshop
Um unsere automatische Transkription zu nutzen, arbeitest Du mit Zeitkontingenten. Diese kannst Du ganz einfach in unserem Onlineshop als Guthabencodes erwerben. Hier einige wichtige Punkte dazu: Du erhältst die Codes bequem per E-Mail. Die Codes sind nicht an Dich persönlich gebunden. Das bedeutet, Du kannst sie flexibel einsetzen oder sogar weitergeben. Wichtig ist nur, dass der Nutzer bei uns registriert ist.
Wenn Du bei uns einkaufst, speichern wir bestimmte Informationen: Name, Adresse, E-Mail-Adresse, Telefonnummer, Bestelldatum und gekaufte Artikel. Diese Daten benötigen wir für unsere Buchhaltung und Abrechnung. Wir speichern sie auf dem Server unseres Webshops und auf unserem eigenen Server in Marburg. Dabei halten wir uns an die gesetzlichen Aufbewahrungsfristen.
Deine Zahlungsdaten, besonders Kreditkarteninformationen, behandeln wir mit höchster Sorgfalt: Wir selbst speichern keine Kreditkartendaten. Die Zahlung wickeln wir über sichere Systeme (sogenannte Iframes) oder direkte Zahlungsseiten von Stripe und PayPal ab.
V. Abwicklung der Einzelaufträge
So läuft ein Einzelauftrag (also die Transkription eines Interviews) bei uns ab
Wenn Du unseren Service nutzt, durchläuft Dein Auftrag mehrere Schritte:
- Du lädst Deine Audiodatei auf unseren Server hoch.
- Wir bearbeiten die Datei auf unserem Server.
- Du lädst das fertige Ergebnis herunter.
- Wir löschen die Auftragsdaten von unserem Server.
Wichtig für Dich zu wissen: Wir speichern Deine Auftragsdaten nur so lange auf unserem Server, wie es für die Verarbeitung unbedingt nötig ist. Sobald Du das Ergebnis heruntergeladen hast, werden die Daten auf Deinen Rechner übertragen. Dort kannst Du sie dann lokal speichern und weiter damit arbeiten.
1. Hochladen von Audiodateien
Audiodateien können auf unseren Server hochgeladen werden, wenn Sie registriert und an einem Client angemeldet sind. Der Client erzeugt für jede Audiodatei beim Upload ein asymetrisches Schlüsselpasswort. Der öffentliche Schlüssel wird beim Upload gemeinsam mit der Audiodatei an den Server gesendet (Jobschlüssel). Der private Schlüssel wird bei Nutzung von f4 auf dem Client-Rechner mit Ihrem geheimen Passwort verschlüsselt und abgelegt. So ist sichergestellt, dass die Auftragsdaten nur vom registrierten Client aus entschlüsselt werden können. Bei Nutzung von f4x über den Browser wird dieses Passwort auf einem separaten (von der Spracherkennung getrennten) Server verschlüsselt abgelegt.
Der Upload auf unseren Server erfolgt über eine gesicherte Verbindung. Dateinamen werden vor der Verarbeitung durch zufällige aber eindeutige Namen pseudonymisiert. Bei Nutzung von f4 bereits während des Uploads.
2. Bearbeitung
Zur Bearbeitung wird die Audiodatei durch den Spracherkennungsalgorithmus entschlüsselt und in eine Textdatei umgesetzt. Die Audiodatei wird direkt nach der erfolgreichen Umsetzung in eine Textdatei gelöscht. Die fertige Textdatei wird mit dem öffentlichen Schlüssel des Jobs verschlüsselt auf dem Server zur Abholung zwischengespeichert.
Der Server meldet zu jedem Job einen Status an den Client. Erfolgreich umgesetzte Jobs melden den Status an den Client und aktivieren dort den „Download“-Button.
3. Download
Die fertigen Textdateien können vom Client heruntergeladen werden. Nach erfolgreichem Download wird die Textdatei durch den privaten Key auf dem Client entschlüsselt. Bei Nutzung von f4 stellt die Kombination aus öffentlichem und privatem Schlüssel sicher, dass die Ergebnisse nur auf dem Rechner entschlüsselt werden können, von dem der Auftrag hochgeladen wurde. Bei Nutzung über den Browser kann das Ergebnis nur mit korrekten Anmeldedaten entschlüsselt werden.
4. Löschung
Sobald der Server die Meldung über den erfolgreichen Download erhält, wird die Datei vom Server endgültig gelöscht.
Sollte beim Upload ein Fehler aufgetreten sein, z.B. wegen eines nicht erkannten Dateiformats oder des Abbruchs der Verbindung, wird die unvollständige Audiodatei sofort vom Server gelöscht. Der Client erhält sodann einen entsprechenden Hinweis
Sollte ein Ergebnis nach 14 Tagen nicht abgeholt werden, senden wir einen Hinweis per E-Mail. Bleibt dieser Hinweis unbeantwortet, gibt es nach 7 Tagen eine weitere Erinnerung. Sollte die darin genannte Frist zur Abholung von 7 Tagen verstreichen, werden die Auftragsdaten gelöscht und wir informieren hierüber per E-Mail.
VI. Dauer der Datenspeicherung und Datenlöschung
Im Hinblick auf die Dauer der Datenspeicherung und die Datenlöschung ist wie folgt zu differenzieren:
Vertragsdaten werden zur Legitimierung und Auftragskontrolle zunächst dauerhaft auf dem Spracherkennungsserver gespeichert. Die Löschung der Vertragsdaten erfolgt bei der Löschung des Accounts, sofern der Löschung keine vertraglichen und/oder gesetzlichen Aufbewahrungsfristen entgegenstehen. Auftragsdaten, also die Audiodateien und die entsprechenden Textdateien, werden für die Dauer der Bearbeitung bis zum Download durch Sie oder bis zum Verstreichen der vereinbarten Löschfrist gespeichert und sodann automatisch gelöscht. Ergänzende Informationen zu den Auftragsdaten, wie Dateigröße und Datum des Uploads, werden gespeichert, um die Abwicklung und Abrechnung der Einzelaufträge zu ermöglichen und diese zu dokumentieren. Diese Daten werden für die Nachvollziehbarkeit durch Sie und die Dokumentation möglicher Ansprüche so lange gespeichert, wie der Account aktiv ist. Mit der Löschung des Accounts werden die Daten gelöscht. Bestelldaten beim Kauf von Zeitkontingenten (z.B. der Name, die Adresse, die E-Mail-Adresse, die Telefonnummer (optional), das Datum der Bestellung und die Anzahl der bestellten Artikel) werden für Abrechnungs- und Buchhaltungszwecke auf den Server des Webshops und auf unseren Inhouse-Server in Marburg geladen und entsprechend gesetzlicher Aufbewahrungsfristen gespeichert.
Über die genauen Daten, Verarbeitungszwecke und Speicherfristen wird ausführlich in der Datenschutzerklärung informiert.
VII. Infrastruktur zur Datenverarbeitung
Die genutzte Infrastruktur zur Datenverarbeitung ist in vier voneinander physisch unabhängige Bereiche aufgeteilt. Sie werden im Anhang der AVV durch die TOMs über die genutzte Infrastruktur informiert. Hierzu im Einzelnen:
1. Spracherkennungsserver
Der „Spracherkennungsserver“ enthält den Spracherkennungsalgorithmus und verwaltet die Auftragsabwicklung und Nutzerverwaltung. Hier werden die Auftragsdaten während der Bearbeitung zwischengespeichert. Diese Daten werden auf einem Dedicated Root Server der Hetzner Online GmbH in Nürnberg oder Falkenstein verarbeitet.
Das Rechenzentrum ist DIN-ISO/IEC-27001-zertifiziert (dt. Akkreditierungsstelle D-ZM-18855-01-00, Zertifikatsnummer ZN-2016-04). Ein Vertrag zur Auftragsverarbeitung wurde am 29.10.2018 abgeschlossen.
2. Webshop
Der Webshop zum Kauf von Zeitkontingenten und E-Mail-Dienste laufen über einen Server der ALL-INKL.COM Neue Medien Münnich mit Serverstandorten in Dresden und Friedersdorf. Gespeichert werden hier die von Ihnen angegebenen Adressdaten, die gekauften Artikel und die Korrespondenz per E-Mail. Ein Vertrag zur Auftragsverarbeitung wurde am 25.05.2018 geschlossen.
3. Interne Auftragsabwicklung
Für die Abrechnung und Buchhaltung werden Kundendaten auf eigenen Servern in den Geschäftsräumen der dr. dresing & pehl GmbH in Marburg gespeichert und entsprechend gesetzlicher Aufbewahrungsfristen archiviert. Der Zugriff auf die Daten ist insbesondere durch ein Zugriffskonzept (Passwort, restriktive Rechtevergabe etc.) geregelt.
4. Zahlungsabwicklung
Daten für Kreditkartenzahlungen oder für Lastschriftaufträge werden von uns nicht gespeichert. Die Abwicklung dieser Zahlweisen wird über sog. Iframes direkt an den Zahlungsdienstleister BS PAYONE GmbH in Frankfurt am Main weitergeleitet.
Zahlungen per PayPal werden von Ihnen direkt auf der Bezahlseite von PayPal (für Europäische Kunden PayPal (Europe) S.à r.l. et Cie, S.C.A., in Luxemburg) durchgeführt.
5. Server Infrastruktur
Die Kommunikation zwischen Clients und dem Server für die automatische Spracherkennung erfolgt über eine durch den Server zur Verfügung gestellte REST-API. Als Transportverschlüsselung kommt SSL/TLS 1.2 zum Einsatz. Der Server für die automatische Spracherkennung befindet sich in einem ISO zertifizierten Rechenzentrum in Deutschland.
Die Authentifizierung erfolgt bei jedem Request mittels Basic Authentication (Nutzername / Passwort). Das Passwort der nutzenden Person wird in der Datenbank des Spracherkennungsservers als bcrypt Hash (Salt 128 Bit) gespeichert. Das Passwort muss unseren Passwortrichtlinien folgen (minimal 10 Zeichen, mindestens ein Klein- und ein Großbuchstabe, eine Zahl und ein Sonderzeichen).
Als Clients können f4 oder ein Browser dienen. Die Browseranwendung wird auf einem Server im Rechenzentrum von Hetzner zur Verfügung gestellt.
Die Mediendatei befindet sich bis zum Ende der Spracherkennung unverschlüsselt auf dem Server der Spracherkennung und wird nach Abschluss der Erkennung umgehend gelöscht.
Das Transkript wird nach Abschluss der Erkennung erstellt und asymmetrisch mittels ECC-Kurve secp256k1 verschlüsselt. Für jeden Auftrag wird ein separates Schlüsselpaar erzeugt. Bei Nutzung von f4 verbleibt der private Schlüssel lokal auf dem Clientrechner und befindet sich zu keinem Zeitpunkt auf einem unserer Server. Somit kann das Transkript von uns nicht entschlüsselt werden.
Bei Nutzung per Browser wird der private Schlüssel auf dem Server in einem Keyring gespeichert. Alle privaten Schlüssel aller Aufträge eines Nutzers werden in einem separaten Keyring abgelegt. Der Keyring wird symmetrisch mit dem Passwort des Kunden verschlüssel (AES 256). Bei Abholung eines Transkriptes über den Browser wird mittels des zur Authentifizierung ermittelten Passworts der private Schlüssel des Transkriptes aus dem Keyring geholt und dem Server für die Spracherkennung zwecks Entschlüsselung übergeben. Das entschlüsselte Transkript kann dann heruntergeladen werden. Ein auf diese Weise entschlüsseltes Transkript wird spätestens nach 60 Sekunden automatisch gelöscht.
Nach erfolgreicher Abholung verbleibt das verschlüsselte Transkript noch ca. eine Stunde auf dem Server für die Spracherkennung und wird dann automatisch gelöscht.
Stand: 10.09.2024