Et college bekendtgør, at et datasæt vil blive offentliggjort på dets websted indeholdende de karakterer (samlede resultater), som de studerende har opnået på alle de kurser, der tilbydes i løbet af et bestemt år,


1::Navnet på kurserne og, for hvert kursus, den karakter, som den enkelte studerende har fået. Enhver identifikator for den studerende (f.eks. navn, den studerendes referencenummer osv.) bliver udeladt eller er blevet erstattet af betydningsløse referencenumre. Andre personoplysninger for studerende (alder, køn osv.) kan være anført på listen.
3::Navnet på kurserne, og for hvert kursus, de opnåede karakterer, uden andre oplysninger.
2::Navnet på kurserne, og for hvert kursus, de opnåede karakterer, uden andre oplysninger.

Det er desværre ikke det rigtige svar. En dataliste bør anses for at være anonymiseret, hvis det ikke er muligt at identificere en person på listen, når alle midler tages i betragtning, der med rimelighed kan tænkes bragt i anvendelse af en anden person. Derfor er det, hvis man erstatter identifikatorer med andre betydningsløse referencenumre, ikke anonymisering, men pseudonymisering. F.eks. kan vi, når vi ved, at kun John har fået karakteren 10 for kursus A, finde ud af, hvilket referencenummer på listen, der svarer til John, og efterfølgende alle de karakterer, som John har fået på alle kurser. Selv om vi simpelthen udelader alle de unikke identifikatorer, kan en kombination af andre personoplysninger også føre til identifikation (f.eks. hvis vi ved, at den eneste mand på 21 er John).

 

Det rigtige svar i forbindelse med dette scenario er navnet på kurserne, og for hvert kursus, de opnåede karakterer, uden andre oplysninger. Det er generelt svært at opnå fuld anonymisering, hvis en liste med nyttige data skal offentliggøres. Blot at fjerne eller ændre personers identifikatorer betyder ikke anonymisering. Der er specifikke anonymiseringsmetoder, som den, der offentliggør dataene, bør følge for at håndtere en række risici for afanonymisering. Se rapporten fra ENISA om Privacy by Design in Big Data for at få flere oplysninger: https://www.enisa.europa.eu/publications/big-data-protection

 

Det er det rigtige svar. En dataliste bør anses for at være anonymiseret, hvis det ikke er muligt at identificere en person på listen, når alle midler tages i betragtning, der med rimelighed kan tænkes bragt i anvendelse af en anden person. Det er generelt svært at opnå fuld anonymisering, hvis en liste med nyttige data skal offentliggøres. Blot at fjerne eller ændre personers identifikatorer betyder ikke anonymisering. Der er specifikke anonymiseringsmetoder, som den, der offentliggør dataene, bør følge for at håndtere en række risici for afanonymisering. Se rapporten fra ENISA om Privacy by Design in Big Data for at få flere oplysninger: https://www.enisa.europa.eu/publications/big-data-protection

 

Dette er kun delvist korrekt. Denne liste, som er en simpel liste over karakterer (dvs. tal), er fuldstændig anonymiseret, da det ikke er muligt at identificere en person på listen, når alle midler tages i betragtning, der med rimelighed kan tænkes bragt i anvendelse af en anden person. Det er imidlertid ikke en nyttig liste i forbindelse med det påtænkte formål, som er offentliggørelse (vi kan f.eks. ikke beregne gennemsnitsværdierne af karaktererne for kursus A). Det korrekte svar i forbindelse med dette scenario er navnet på kurserne, og for hvert kursus, de opnåede karakterer, uden andre oplysninger. Det er generelt svært at opnå fuld anonymisering, hvis en liste med nyttige data skal offentliggøres. Blot at fjerne eller ændre personers identifikatorer betyder ikke anonymisering. Der er specifikke anonymiseringsmetoder, som den, der offentliggør dataene, bør følge for at håndtere en række risici for afanonymisering. Se rapporten fra ENISA om Privacy by Design in Big Data for at få flere oplysninger: https://www.enisa.europa.eu/publications/big-data-protection



med henblik på at give alle mulighed for yderligere behandling i forbindelse med videnskabelig/statistisk analyse, dvs. at beregne gennemsnitsværdier og andre statistiske oplysninger om karaktererne for hvert kursus. Colleget oplyser i bekendtgørelsen, at listen bliver fuldstændig anonymiseret. 

Hvilke data på en sådan fuldstændig anonymiseret liste forventer du at se?