Eine Universität kündigt an, dass ein Datensatz auf ihrer Webseite veröffentlicht wird, der die in einem bestimmten Jahr für alle angebotenen Kurse an die Studenten vergebenen Noten (Gesamtpunktzahlen) umfasst,


1::Die Namen der Kurse und die Note, die jedem Studenten für jeden Kurs gegeben wurde. Jegliches Identifikationsmerkmal des Studenten (z. B. Name, Studentennummer usw.) wird ausgelassen oder durch eine bedeutungslose Kennzahl ersetzt sein. Andere personenbezogene Informationen der Studenten (Alter, Geschlecht usw.) können in der Liste erscheinen.
3::Die Namen der Kurse und alle, für jeden einzelnen Kurs vergebenen Noten, ohne jegliche weitere Informationen.
2::Nur die den Studenten zugewiesenen Noten; keine weiteren Informationen (nicht einmal die entsprechenden Kurse)

Leider ist diese Antwort nicht richtig. Eine Datenliste kann dann als anonymisiert erachtet werden, wenn es unter Berücksichtigung aller Mittel, die von einer anderen Person mit annehmbarer Wahrscheinlichkeit verwendet werden könnten, nicht möglich ist, irgendeine Person der Liste zu identifizieren. Daher handelt es sich beim Ersetzen von Identifikationsmerkmalen durch bedeutungslose Kennzahlen nicht um eine Anonymisierung, sondern um eine Pseudonymisierung. Wenn wir beispielsweise wissen, dass nur Peter die Note 10 für den Kurs A bekommen hat, können wir der Liste die entsprechende Kennzahl für Peter entnehmen und in der Folge alle Noten, die Peter für alle Kurse erhalten hat, herausfinden. Selbst wenn wir einfach alle eindeutigen Identifikationsmerkmale auslassen, kann die Kombination anderer personenbezogener Informationen ebenfalls zu einer Identifizierung führen (z. B. wenn wir wissen, dass der einzige Mann im Alter von 21 Jahren Peter ist).

 

Die richtige Antwort in diesem Szenario lautet der Name des Kurses und alle, für jeden einzelnen Kurs vergebenen Noten, ohne jegliche weitere Informationen. Im Allgemeinen ist es ziemlich schwierig, eine vollständige Anonymisierung zu erreichen, wenn man eine Liste mit nützlichen Daten veröffentlichen möchte. Eine einfache Entfernung oder Veränderung der Identifikationsmerkmale einer Person stellt keine Anonymisierung dar. Es gibt spezielle Anonymisierungsmethoden, die der Herausgeber anwenden sollte, um verschiedenen Risiken einer Deanonymisierung gerecht zu werden. Weitere Informationen finden Sie im ENISA-Bericht über Privatsphäre durch Technikgestaltung bei Big Data: https://www.enisa.europa.eu/publications/big-data-protection (auf Englisch)

 

Diese Antwort ist richtig. Eine Datenliste kann dann als anonymisiert erachtet werden, wenn es unter Berücksichtigung aller Mittel, die von einer anderen Person mit annehmbarer Wahrscheinlichkeit verwendet werden könnten, nicht möglich ist, irgendeine Person der Liste zu identifizieren. Im Allgemeinen ist es ziemlich schwierig, eine vollständige Anonymisierung zu erreichen, wenn man eine Liste mit nützlichen Daten veröffentlichen möchte. Eine einfache Entfernung oder Veränderung der Identifikationsmerkmale einer Person stellt keine Anonymisierung dar. Es gibt spezielle Anonymisierungsmethoden, die der Herausgeber anwenden sollte, um verschiedenen Risiken einer Deanonymisierung gerecht zu werden. Weitere Informationen finden Sie im ENISA-Bericht über Privatsphäre durch Technikgestaltung bei Big Data: https://www.enisa.europa.eu/publications/big-data-protection (auf Englisch)

 

Diese Antwort ist nur teilweise richtig. In der Tat wäre diese Liste, eine schlichte Liste an Noten (d. h. Nummern) vollständig anonymisiert, da es nicht möglich ist, irgendeine Person der Liste zu identifizieren, auch wenn man alle Mittel in Betracht zieht, die eine andere Person mit annehmbarer Wahrscheinlichkeit verwenden könnte. Diese Liste wäre allerdings im Zusammenhang mit dem Zweck der Veröffentlichung unnütz (z. B. können wir die Durchschnittsnote für Kurs A nicht berechnen). Die richtige Antwort in diesem Szenario lautet: der Name des Kurses und alle, für jeden einzelnen Kurs vergebenen Noten, ohne jegliche weitere Informationen. Im Allgemeinen ist es ziemlich schwierig, eine vollständige Anonymisierung zu erreichen, wenn man eine Liste mit nützlichen Daten veröffentlichen möchte. Eine einfache Entfernung oder Veränderung der Identifikationsmerkmale einer Person stellt keine Anonymisierung dar. Es gibt spezielle Anonymisierungsmethoden, die der Herausgeber anwenden sollte, um verschiedenen Risiken einer Deanonymisierung gerecht zu werden. Weitere Informationen finden Sie im ENISA-Bericht über Privatsphäre durch Technikgestaltung bei Big Data: https://www.enisa.europa.eu/publications/big-data-protection (auf Englisch)



um jedem die weitere Verarbeitung der Daten für wissenschaftliche bzw. statistische Analysen zu ermöglichen, d. h. um Durchschnittswerte, Mindest- und Höchstwerte sowie andere statistische Daten über die Noten für jeden Kurs zu errechnen. Die Universität erklärt in Ihrer Ankündigung, dass die Liste vollständig anonymisiert sein wird. 

Welche Daten erwarten Sie auf einer solchen vollständig anonymisierten Liste?