En högskola meddelar att ett dataset kommer att offentliggöras på dess webbplats, med studenternas betyg (totala poäng) i alla kurser som erbjuds under ett visst år


1::Kursernas namn och varje students betyg för varje kurs. Studentens alla identifieringsuppgifter (t.ex. namn, referensnummer m.m.) kommer att utelämnas eller ha ersatts av andra betydelselösa referensnummer. Annan personlig information om studenterna (ålder, kön m.m.) får stå på listan.
3::Kursernas namn och de tilldelade betygen för varje kurs, utan någon annan information.
2::Endast de betyg som studenterna fått – ingen annan information (inte ens motsvarande kurser).

Tyvärr fel svar. En lista med denna typ av uppgifter anses vara anonymiserad om det inte går att identifiera någon person på listan, med hänsyn till alla uppgifter som någon annan person rimligen kan använda sig av för att göra detta.  Att ersätta identifieringsuppgifter med andra betydelselösa referensnummer är inte anonymisering utan pseudonymisering. Genom att t.ex. veta att John var den enda som fick 10 i betyg för kurs A kan vi ta reda på vilket referensnummer på listan som motsvarar John, och följaktligen, alla betyg som John fått för alla kurser. Även om vi helt enkelt utelämnar alla unika identifieringsuppgifter kan en kombination av annan personlig information också leda till identifiering (t.ex. om vi vet att John är den enda man som är 21 år).  

 

Rätt svar i detta scenario är kursernas namn och de tilldelade betygen för varje kurs, utan någon annan information. I regel är det ganska svårt att få till fullständig anonymisering om en lista med användbara uppgifter ska offentliggöras. Att helt enkelt stryka eller ändra en persons identifieringsuppgifter innebär inte anonymisering. Det finns särskilda anonymiseringsmetoder som den som offentliggör uppgifterna bör följa för att hantera de många riskerna med avanonymisering. Mer information finns i Enisas rapport Privacy by Design in Big Data: https://www.enisa.europa.eu/publications/big-data-protection

 

Rätt svar. En lista med denna typ av uppgifter anses vara anonymiserad om det inte går att identifiera någon person på listan, med hänsyn till alla uppgifter som någon annan person rimligen kan använda sig av för att göra detta.  I regel är det ganska svårt att få till fullständig anonymisering om en lista med användbara uppgifter ska offentliggöras. Att helt enkelt stryka eller ändra en persons identifieringsuppgifter innebär inte anonymisering. Det finns särskilda anonymiseringsmetoder som den som offentliggör uppgifterna bör följa för att hantera de många riskerna med avanonymisering. Mer information finns i Enisas rapport Privacy by Design in Big Data: https://www.enisa.europa.eu/publications/big-data-protection

 

Detta är bara rätt till viss del. Denna lista, som förvisso är en ren betygslista (dvs. med siffror), är helt anonymiserad eftersom det inte går att identifiera någon person på listan, med hänsyn till alla uppgifter som någon annan person rimligen kan använda sig av för att göra detta. Men listan är inte användbar i detta sammanhang (t.ex. kan vi inte beräkna medelvärdena för de betyg som tilldelats för kurs A). Rätt svar i detta scenario är kursernas namn och de tilldelade betygen för varje kurs, utan någon annan information. I regel är det ganska svårt att få till fullständig anonymisering om en lista med användbara uppgifter ska offentliggöras. Att helt enkelt stryka eller ändra en persons identifieringsuppgifter innebär inte anonymisering. Det finns särskilda anonymiseringsmetoder som den som offentliggör uppgifterna bör följa för att hantera de många riskerna med avanonymisering. Mer information finns i Enisas rapport Privacy by Design in Big Data: https://www.enisa.europa.eu/publications/big-data-protection

 


för att vem som helst ska kunna bearbeta dessa uppgifter ytterligare av vetenskapliga/statistiska skäl, dvs. beräkna medelvärden samt högsta och lägsta värden liksom annan statistisk information om betygen för varje kurs. Högskolan uppger i sitt meddelande att listan kommer att göras helt anonym.

 

Vilka uppgifter förväntar du dig att se på en sådan helt anonymiserad lista?