Fakultet najavi da će na web-mjestu javno objaviti skup podataka koji sadržava ocjene (ukupno bodovanje) dodijeljeno studentima iz svih kolegija ponuđenih u jednoj određenoj godini,


1::Ime kolegija i, za svaki kolegij, ocjenu dodijeljenu svakom studentu. Svi identifikatori studenata (npr. ime, matični broj studenta itd.) bit će izostavljeni ili će biti zamijenjeni drugim besmislenim brojevima. Druge osobne informacije studenata (dob, spol itd.) mogle bi biti na popisu.
3::Ime kolegija i dodijeljene ocjene u svakom kolegiju, bez bilo kojih drugih informacija.
2::Samo ocjene dodijeljene studentima; nikakve druge informacije (čak niti odgovarajući kolegiji)

Nažalost, odgovor nije točan. Popis podataka smatrao bi se anonimiziranim ako nije moguće identificirati bilo koju osobu s popisa, uzimajući u obzir sva moguća sredstva kojima bi se opravdano mogla koristiti bilo koja osoba. Dakle, zamjena identifikatora drugim besmislenim brojevima nije anonimizacija već psudonimizacija; npr. ako znamo da je samo John dobio ocjenu 10 u kolegiju A, možemo saznati njegov matični broj na popisu koji se podudara s njegovim podacima i, nakon toga, sve ocjene dodijeljene Johnu u svim kolegijima. Čak i ako jednostavno izostavimo sve jedinstvene identifikatore, kombinacija drugih osobnih informacija također može dovesti do identifikacije (npr. ako znamo da je John jedini muškarac star 21 godinu).

 

Točan odgovor u ovom scenariju je ime kolegija i dodijeljene ocjene u svakom kolegiju, bez bilo kojih drugih informacija. Općenito, jako je teško postići potpunu anonimizaciju, ako treba biti objavljen popis s korisnim informacijama. Jednostavno uklanjanje ili mijenjanje nečijih identifikatora ne znači anonimizaciju. Postoje određene metode anonimizacije koje treba slijediti pri objavljivanju, kako bi pokrili više rizika za deanonimizaciju. Za više informacija vidi izvještaj ENISA-e, Privatnost i tehnička zaštita podataka: https://www.enisa.europa.eu/publications/big-data-protection

 

Odgovor je točan. Popis podataka smatrao bi se anonimiziranim ako nije moguće identificirati bilo koju osobu s popisa, uzimajući u obzir sva moguća sredstva kojima bi se opravdano mogla koristiti bilo koja osoba. Općenito, jako je teško postići potpunu anonimizaciju, ako treba biti objavljen popis s korisnim informacijama. Jednostavno uklanjanje ili mijenjanje nečijih identifikatora ne znači anonimizaciju. Postoje određene metode anonimizacije koje treba slijediti pri objavljivanju, kako bi pokrili više rizika za deanonimizaciju. Za više informacija vidi izvještaj ENISA-e, Privatnost i tehnička zaštita podataka: https://www.enisa.europa.eu/publications/big-data-protection

 

Djelomično je točno. Uistinu, ovaj popis, koji je obični popis ocjena (tj. brojeva) je potpuno anonimiziran jer nije moguće identificirati bilo koju osobu s popisa, uzimajući u obzir sva moguća sredstva kojima bi se opravdano mogla koristiti bilo koja osoba. Međutim, u kontekstu namjeravane svrhe objavljivanja, taj popis nije koristan (npr. ne možemo izračunati srednje vrijednosti ocjena dodijeljene u kolegiju A). Točan odgovor u ovom scenariju je ime kolegija i dodijeljene ocjene u svakom kolegiju, bez bilo kojih drugih informacija. Općenito, jako je teško postići potpunu anonimizaciju, ako treba biti objavljen popis s korisnim informacijama. Jednostavno uklanjanje ili mijenjanje nečijih identifikatora ne znači anonimizaciju. Postoje određene metode anonimizacije koje treba slijediti pri objavljivanju, kako bi pokrili više rizika za deanonimizaciju. Za više informacija vidi izvještaj ENISA-e, Privatnost i tehnička zaštita podataka: https://www.enisa.europa.eu/publications/big-data-protection



kako bi se svima omogućila daljnja obrada za znanstvenu/statističku analizu, tj. izračunavanje srednjih vrijednosti, kao i maksimalne i minimalne vrijednosti i druge statističke informacije o ocjenama u svakom pojedinim kolegiju. Fakultet u najavi tvrdi da će popis biti potpuno anonimiziran. 

Koje podatke očekujete vidjeti u takvom potpuno anonimiziranom popisu?