Datensicherheit im Alltag: Datenschutz bei Sprachassistenten, Episode 1
Unser Alltag wird durch Sprachassistenten wie beispielsweise Alexa, Siri und Google Assistant wesentlich erleichtert. Sie gestalten etliche Tätigkeiten bequemer und sorgen in Teilen für namhafte Zeitersparnis. So können uns die Sprachassistenten einen schnellen, mündlichen Zugriff auf das Wetter oder die Zeit geben, unser Lieblingslied spielen, Bestellungen für uns tätigen oder das Licht an- und ausschalten. Auch sehbehinderte Menschen können durch Sprachassistenten unterstützt werden, in dem sie sich beispielsweise Zeitungsartikel oder Rezepte vorlesen lassen oder Bestellungen per Sprachbefehl tätigen können.

Privatsphäre und Datenschutz sind im Hinblick auf diese neue Technologie allerdings oftmals kritisch zu betrachten. Die Privatsphäre stellt ein hohes Gut dar und muss entsprechend auch bei der Anwendung von Sprachassistenten vollumfänglich geschützt werden. Von Datenschützern und Verbraucherschützern werden Sprachassistenten vermehrt kritisiert, da der Datenschutz beim Einsatz nicht vollumfänglich erbracht wird. In der heutigen Presse werden die Sprachassistenten vermehrt als moderne Wanzen bezeichnet, die sich rund um die Uhr im Lauschmodus befinden.

Allgemein wird ein Sprachassistent als Software bzw. Technologie bezeichnet, die es ermöglicht, mittels Kommunikation in natürlicher, menschlicher Sprache Informationen abzufragen. Dabei wird das gesprochene Wort analysiert und in den korrekten Kontext eingeordnet, sodass vom Sprachassistenten hierauf reagiert werden kann. Vorwiegend sind Sprachassistenten in smarten Lautsprechern, Smartphones, Tablets oder im Fahrzeug vorzufinden. Zusätzlich können auch Smart-Home-Geräte durch Spracheingaben gesteuert werden. Grob gesagt vereinfachen Sprachassistenten die Kommunikation zwischen Mensch und Maschine.

Da Sprachassistenten nur auf Zuruf in Verbindung mit intelligenten Lautsprechern funktionieren, ist es primäre Voraussetzung, dass die Mikrofone dauerhaft eingeschaltet sind, sodass das Befehls- bzw. Aktivierungswort jederzeit vom Nutzer geäußert werden kann und der Sprachassistent die Möglichkeit hat, hierauf zeitnah zu reagieren. Nehmen wir zur Verdeutlichung den Sprachassistent „Alexa“. Der Smartspeaker von Alexa besitzt sieben Mikrofone, welche im 360-Grad-Kreis angeordnet sind. Das bedeutet, er ist kontinuierlich bereit, Sprachbefehle entgegenzunehmen, auch wenn er gerade nicht direkt angesprochen wird. Bedeutend ist in diesem Kontext, dass die Echo-Geräte die ganze Zeit mithören müssen, um auf das Aktivierungswort „Alexa“ überhaupt reagieren zu können. Ab dem Zeitpunkt der Befehlsabgabe findet eine Datenübertragung an die Anbieterserver statt. Durch die dauerhafte Einschaltung werden laut Aussage der Hersteller, alle Worte und Geräusche zunächst nur lokal aufgenommen und erst mit dem Aktivierungswort ins Netz und an den Hersteller übermittelt. In der Regel sollte bei Einschaltung der Mikrofone also keine Verbindung zur Cloud bestehen, sodass auch keine Daten an die Server gesendet werden können.

Erst durch die Befehls- bzw. Aktivierungswörter wie beispielsweise „Alexa“ oder „Hey Siri“ sollte eine Verbindung zur Cloud aufgebaut werden und die darauffolgenden Befehle oder Fragen an die Server gesendet werden. Vorliegendes Vorgehen würde auch den Vorgaben der DSGVO entsprechen, wobei grundsätzlich nur Daten verarbeitet werden dürfen, die auch für den Verwendungszweck von Relevanz sind. Des Weiteren müssten auf Wunsch der Anwender nach Art. 17 DSGVO alle personenbezogenen Daten gelöscht werden. Die Problematik hierbei ist aber oftmals, dass ähnlich klingende Worte von dem Sprachassistenten als Aktivierungswort verstanden werden und sie dementsprechend in diesen Fällen auch eine Verbindung zur Cloud aufbauen und Daten speichern. Dabei lassen sich unter Umständen den aufgezeichneten Gesprächen, zum Teil sensible Informationen aus der Privat- und Intimsphäre entnehmen, ohne dass dies den Betroffenen bewusst ist. Schlussendlich haben die Anwender keine Kenntnis davon ob und ggf. welche Daten vom Sprachassistenten gespeichert und an die Hersteller übermittelt worden sind. Allerdings besagt der Transparenzgrundsatz der Datenschutzgrundverordnung, dass Unternehmen transparent gestalten müssen, welche Inhalte sie speichern. Bei Nichteinhaltung der Verordnung drohen den Unternehmen hohe Geldstrafen von bis zu 4 % des weltweiten Jahresumsatzes.

Ein praxisnahes Beispiel bildet unter anderem die gravierende Datenschutzpanne aus dem Jahr 2018. Im vorliegenden Fall versendete Alexa ein Gespräch eines Ehepaars an einen zufälligen Kontakt. Amazon beteuerte hierbei, dass es sich um eine „unwahrscheinliche“ Verkettung von Ereignissen handelte, welche zu dieser Panne führten. Die vermehrten Datenschutzbedenken, welche sich insbesondere durch die fehlerhaften Reaktionen und Aufnahmen der Gespräche durch den Sprachassistenten ergeben haben, haben viele Hersteller, u.a. auch Amazon, ernst genommen. So wurde bei den Lautsprechern eine separate Taste verbaut, mit welcher die Anwender Mikrofone ausschalten können. Zusätzlich besteht innerhalb der Apps die Möglichkeit, die Historie der getätigten Sprachanfragen zu löschen. Ob die Daten aber auch von den Servern gelöscht werden, ist nicht bekannt. Aus Entwicklersicht müssen die Sprachassistenten permanent aktiv sein, um die Systeme durchgehend verbessern zu können. Wobei die Verbesserung auch nur möglich ist, sofern möglichst viele Daten gesammelt und gespeichert werden.

Lesen Sie hierzu auch gerne unseren zweiten Teil des Beitrages „Datensicherheit im Alltag: Datenschutz bei Sprachassistenten, Episode 2“ in welchen wir uns sowohl mit der Datenspeicherung und Weitergabe als auch den Sicherheitslücken beschäftigen werden.

Essenz

  • Sprachassistenz als Kommunikationsvereinfachung zwischen Mensch und Maschine
  • Zuruf funktioniert in Kombination mit intelligenten Lautsprechern
  • lokale Aufnahme aller Worte und Geräusche durch den Sprachassistenten
  • bei Befehlsabgabe findet eine Datenübertragung an die Anbieterserver statt
  • vermehrte Datenschutzbedenken insbesondere bei fehlerhafter Reaktion und Aufnahme der Gespräche in Unkenntnis der Betroffenen
  • erste verbessernde Hersteller-Reaktionen, z.B. durch ausschaltbare Mikrofone