Vysoká škola oznamuje, že bude na její internetové stránce zveřejněn datový soubor, který obsahuje známky (celkové hodnocení) studentů ve všech kurzech nabízených v jednom konkrétním roce


1::Název kurzu a u každého kurzu známku každého studenta. Všechny identifikátory studenta (např. jméno, referenční číslo studenta atd.) budou vynechány, popř. budou nahrazeny jinými bezobsažnými referenčními čísly. Jiné osobní údaje o studentech (věk, pohlaví apod.) mohou být v seznamu uvedeny.
3::Název kurzu a u každého kurzu známku bez jakýchkoli dalších údajů.
2::Pouze známky studentů; žádné jiné údaje (dokonce ani odpovídající kurzy)

Bohužel to není správná odpověď. Seznam údajů by se měl považovat za anonymizovaný, teprve když není možné identifikovat žádnou osobu na seznamu, s přihlédnutím ke všem prostředkům, které by s největší pravděpodobností využily jakékoli jiné osoby. Nahrazení identifikátorů jinými bezobsažnými referenčními čísly není tedy anonymizace, ale pseudonymizace; např. když víme, že pouze John má známku 10 z kurzu A, můžeme zjistit referenční číslo v seznamu, které odpovídá Johnovi, a následně všechny známky, které John dostal ve všech kurzech. I kdybychom vynechali všechny jedinečné identifikátory, kombinace jiných osobních údajů může také vést k identifikaci (např. když víme, že jediným mužem ve věku 21 let je právě John).

 

Správná odpověď v tomto scénáři je název kurzů a u každého kurzu přidělená známka bez jakýchkoli dalších údajů. Obecně je poměrně obtížné dosáhnout plné anonymizace, pokud se má seznam s užitečnými údaji zveřejnit. Prosté odstranění nebo změna identifikátorů osob neznamená anonymizaci. Existují specifické metody anonymizace, které by měl vydavatel dodržet, pokud chce řešit různá rizika deanonymizace. Více informací viz zpráva ENISA „Záměrná ochrana soukromí u velkých objemů dat“. https://www.enisa.europa.eu/publications/big-data-protection

 

To je správná odpověď. Seznam údajů by se měl považovat za anonymizovaný, teprve když není možné identifikovat žádnou osobu na seznamu, s přihlédnutím ke všem prostředkům, které by s největší pravděpodobností využily jakékoli jiné osoby. Obecně je poměrně obtížné dosáhnout plné anonymizace, pokud se má seznam s užitečnými údaji zveřejnit. Prosté odstranění nebo změna identifikátorů osob neznamená anonymizaci. Existují specifické metody anonymizace, které by měl vydavatel dodržet, pokud chce řešit různá rizika deanonymizace. Více informací viz zpráva ENISA „Záměrná ochrana soukromí u velkých objemů dat“. https://www.enisa.europa.eu/publications/big-data-protection

 

To je pouze částečně správná odpověď. Tento jednoduchý seznamem se známkami (tj. seznam čísel) je skutečně plně anonymizovaný, protože není možné identifikovat žádnou osobu v seznamu, s přihlédnutím ke všem prostředkům, které by s největší pravděpodobností využily jakékoli jiné osoby. Seznam však není užitečný, pokud bylo záměrem jeho zveřejnění (např. nemůžeme vypočítat průměrné hodnoty známek udělených v kurzu A). Správná odpověď v tomto scénáři je název kurzů a u každého kurzu přidělená známka bez jakýchkoli dalších údajů. Obecně je poměrně obtížné dosáhnout plné anonymizace, pokud se má seznam s užitečnými údaji zveřejnit. Prosté odstranění nebo změna identifikátorů osob neznamená anonymizaci. Existují specifické metody anonymizace, které by měl vydavatel dodržet, pokud chce řešit různá rizika deanonymizace. Více informací viz zpráva ENISA Záměrná ochrana soukromí u velkých objemů dat“: https://www.enisa.europa.eu/publications/big-data-protection



aby se každému umožnilo další zpracování pro vědeckou/statistickou analýzu, tj. výpočet průměrné hodnoty a maximálních a minimálních hodnot a jiných statistických údajů vycházejících ze známek z každého kurzu. Vysoká škola ve svém oznámení uvádí, že seznam bude plně anonymizován. 

Jaké údaje byste v takovém plně anonymizovaném seznamu očekávali?