Egy főiskola bejelenti, hogy a honlapján nyilvánosan meg fog jelentetni egy adathalmazt, amelyben szerepelnek egy adott évben oktatott összes tantárgy hallgatóinak érdemjegyei (teljes pontszáma),


1::A tantárgyak nevei és minden egyes tantárgy esetén az egyes hallgatókhoz rendelt érdemjegyek. A hallgatók minden azonosítóját (úgy mint név, hallhatói azonosító szám stb.) mellőzni kell, illetve egyéb, értelmetlen hivatkozási számmal kell helyettesíteni. A hallgatók további személyes információi (kor, nem stb.) szerepelhetnek a listában.
3::A tantárgyak nevei és minden egyes tantárgy esetén az egyes hallgatókhoz rendelt érdemjegyek, bármely további információ nélkül.
2::Csak a hallgatóknak adott érdemjegyek, és semmilyen további információ (még a megfelelő tantárgyak sem)

Sajnálatos módon ez nem a helyes válasz. Egy adatlista akkor tekinthető anonimizáltnak, ha nem lehetséges a listán szereplő bármely személyt azonosítani, figyelembe véve az összes olyan eszközt, amelyet valószínűsíthetően és ésszerűen bármely más személy erre használhat. Ezért az azonosítók más, értelmetlen hivatkozási számokkal való helyettesítése nem anonimizálásnak, hanem pszeudonimizálásnak (álnévhasználat) minősül. Például, ha tudjuk, hogy csak János kapott 10-est az „A” tantárgyból, meg tudjuk találni a listában a Jánost rejtő hivatkozási számot, és ezt követően a János által minden egyes tantárgyra kapott érdemjegyet fel tudjuk kutatni. Még akkor is, ha egyszerűen elhagyjuk az összes egyedi azonosítót, más személyes adatok kombinációja lehetővé teheti az azonosítást (például ha tudjuk, hogy János közöttük az egyetlen 21 éves).

 

A helyes válasz ezen szituáció esetében: a tantárgyak nevei és minden egyes tantárgy esetében az elért érdemjegyek, bármilyen további információ nélkül. Általában elég nehéz a teljes anonimizálást megvalósítani hasznos adatokat tartalmazó listák közzétételekor. A személyek azonosítóinak puszta eltávolítása vagy megváltoztatása nem minősül anonimizálásnak. Vannak konkrét anonimizálási módszerek, amelyeket az adatokat nyilvánosságra hozó félnek be kell tartania az anonimizált adatok újra azonosíthatóvá tételével (deanonimizálás) kapcsolatos kockázatok kezelése érdekében. További információkért lásd az Európai Hálózat- és Információbiztonsági Ügynökség (ENISA) által „Beépített adatvédelem a Big Data esetén” témában készített jelentést: https://www.enisa.europa.eu/publications/big-data-protection

 

Ez a helyes válasz. Egy adatlista akkor tekinthető anonimizáltnak, ha nem lehetséges a listán szereplő bármely személyt azonosítani, figyelembe véve az összes olyan eszközt, amelyet valószínűsíthetően és ésszerűen bármely más személy erre használhat. Általában elég nehéz a teljes anonimizálást megvalósítani hasznos adatokat tartalmazó listák közzétételekor. A személyek azonosítóinak puszta eltávolítása vagy megváltoztatása nem minősül anonimizálásnak. Vannak konkrét anonimizálási módszerek, amelyeket az adatokat nyilvánosságra hozó félnek be kell tartania az anonimizált adatok újra azonosíthatóvá tételével (deanonimizálás) kapcsolatos kockázatok kezelése érdekében. További információkért lásd az Európai Hálózat- és Információbiztonsági Ügynökség (ENISA) által „Beépített adatvédelem a Big Data esetén” témában készített jelentést: https://www.enisa.europa.eu/publications/big-data-protection

 

Ez csak részben helyes. Ez a lista, amely csak az érdemjegyeket (vagyis számokat) tartalmazza, valóban teljes mértékben anonimizált, mivel nem lehetséges a listán szereplő egyik személyt sem azonosítani, figyelembe véve az összes olyan eszközt, amelyet valószínűsíthetően és ésszerűen bármely más személy erre használhat. Ugyanakkor ez a nyilvánosságra hozatal szándékolt célját tekintve ez nem egy hasznos lista (vagyis ez alapján nem lehet kiszámítani az „A” tantárgy esetében adott érdemjegyek átlagos értékeit). A helyes válasz ezen szituáció esetében: a tantárgyak nevei és minden egyes tantárgy esetében az elért érdemjegyek, bármilyen további információ nélkül. Általában elég nehéz a teljes anonimizálást megvalósítani hasznos adatokat tartalmazó listák közzétételekor. A személyek azonosítóinak puszta eltávolítása vagy megváltoztatása nem minősül anonimizálásnak. Vannak konkrét anonimizálási módszerek, amelyeket az adatokat nyilvánosságra hozó félnek be kell tartania az anonimizált adatok újra azonosíthatóvá tételével (deanonimizálás) kapcsolatos kockázatok kezelése érdekében. További információkért lásd az Európai Hálózat- és Információbiztonsági Ügynökség (ENISA) által „Beépített adatvédelem a Big Data esetén” témában készített jelentést: https://www.enisa.europa.eu/publications/big-data-protection



lehetővé téve, hogy ezeket bárki tudományos/statisztikai elemzés céljából tovább feldolgozza, vagyis, hogy az egyes tantárgyak megfelelő érdemjegyei alapján kiszámítsa az átlagos értékeket, a minimum és maximum értékeket, valamint egyéb statisztikai adatokat. Bejelentésében a főiskola tudatja, hogy a listát teljes mértékben anonimizálni fogja. 

Egy ilyen teljesen anonimizált listában várhatóan mely adatok fognak szerepelni?