Kolegija praneša, kad savo svetainėje viešai išplatins duomenų rinkinį, kuriame pateikiami iš visų tam tikrais metais dėstytų kursų gauti studentų pažymiai (bendri balai)


1::Kursų pavadinimai ir kiekvieno studento atskirų kursų pažymiai. Visi studento identifikatoriai (pvz., vardas, studento numeris ir pan.) bus praleisti arba pakeisti kitokiais nereikšmingais nuorodos numeriais. Kitokia asmeninė informacija apie studentus (amžius, lytis ir kt.) gali būti pateikiama sąraše.
3::Kursų pavadinimai ir kiekvieno studento pažymiai iš atskirų kursų, nepateikiant jokios kitos informacijos
2::Tik studentų pažymiai; jokios kitos informacijos (net apie atitinkamus kursus)

Deja, tai nėra teisingas atsakymas. Duomenų sąrašas gali būti laikomas anonimintu, jeigu neįmanoma identifikuoti nė vieno į sąrašą įtraukto asmens, turint omenyje visas priemones, kurias galėtų sąmoningai panaudoti bet kuris kitas asmuo. Todėl identifikatorių pakeitimas nereikšmingais nuorodos numeriais yra ne anoniminimas, o pseudoniminimas; pavyzdžiui, jeigu žinome, kad tik Jonas gavo 10 iš A kurso, sąraše galime surasti Joną atitinkantį nuorodos numerį ir atsekti visų kitų kursų Jono įvertinimus. Net jeigu tik praleidžiame unikalius identifikatorius, nustatyti tapatybę gali padėti ir kitos asmeninės informacijos derinys (pvz., jeigu žinome, kad vienintelis 21 metų vyras yra Jonas).

 

Teisingas atsakymas šiame scenarijuje yra kursų pavadinimai ir kiekvieno kurso pažymiai, nepateikiant jokios kitos informacijos. Apskritai labai sunku užtikrinti visišką anoniminimą, jei sąrašas su reikiamais duomenimis skelbiamas viešai. Vien pašalinus ar pakeitus asmens identifikatorius anoniminimas neužtikrinamas. Taikomi specialūs anoniminimo metodai, kuriais dera vadovautis skelbiant informaciją ir kuriais pašalinama kelių rūšių tapatybės nustatymo rizika. Daugiau informacijos rasite ENISA ataskaitoje „Didžiųjų duomenų projektuojant numatyta privatumo apsauga“: https://www.enisa.europa.eu/publications/big-data-protection

 

Tai teisingas atsakymas. Duomenų sąrašas gali būti laikomas anonimintu, jeigu neįmanoma identifikuoti nė vieno į sąrašą įtraukto asmens, turint omenyje visas priemones, kurias, pagrįstai tikėtina, galėtų panaudoti bet kuris kitas asmuo. Apskritai labai sunku užtikrinti visišką anoniminimą, jei sąrašas su reikiamais duomenimis skelbiamas viešai. Vien pašalinus ar pakeitus asmens identifikatorius anoniminimas neužtikrinamas. Taikomi specialūs anoniminimo metodai, kuriais dera vadovautis skelbiant informaciją ir kuriais pašalinama kelių rūšių tapatybės nustatymo rizika. Daugiau informacijos rasite ENISA ataskaitoje „Didžiųjų duomenų projektuojant numatyta privatumo apsauga“: https://www.enisa.europa.eu/publications/big-data-protection

 

Tai tik iš dalies teisingas atsakymas. Iš tikrųjų toks sąrašas, paprastas pažymių (t. y. skaičių) sąrašas, yra visiškai anonimintas, nes neįmanoma identifikuoti nė vieno į sąrašą įtraukto asmens, turint omenyje visas priemones, kurias, pagrįstai tikėtina, galėtų panaudoti bet kuris asmuo. Tačiau tai nėra naudingas sąrašas atsižvelgiant į tai, kokiu tikslu jis skelbiamas (pvz., negalime apskaičiuoti A kurso pažymių vidurkio). Teisingas atsakymas šiame scenarijuje yra kursų pavadinimai ir kiekvieno kurso pažymiai, nepateikiant jokios kitos informacijos. Apskritai labai sunku užtikrinti visišką anoniminimą, jei sąrašas su reikiamais duomenimis skelbiamas viešai. Vien pašalinus ar pakeitus asmens identifikatorius anoniminimas neužtikrinamas. Taikomi specialūs anoniminimo metodai, kuriais dera vadovautis skelbiant informaciją ir kuriais pašalinama kelių rūšių tapatybės nustatymo rizika. Daugiau informacijos rasite ENISA ataskaitoje „Didžiųjų duomenų projektuojant numatyta privatumo apsauga“: https://www.enisa.europa.eu/publications/big-data-protection   

 


kad juos kiekvienas norintis galėtų toliau apdoroti mokslo ar statistinės analizės tikslais, t. y. vidurkiams, taip pat didžiausioms ir mažiausioms vertėms apskaičiuoti ir kitai statistinei informacijai apie atitinkamų kursų pažymius gauti. Kolegijos pranešime skelbiama, kad sąrašas bus visiškai anonimintas.

 

Kokius duomenis tikėtumėtės išvysti tokiame visiškai anonimintame sąraše?