Колеж обявява, че на уебсайта му публично ще бъде оповестен масив от данни, съдържащ оценките (общ резултат),


1::Имената на курсовете и оценката на всеки студент за всеки курс. Всякакъв вид идентификатор на студента (напр. име, справочен номер на студента и т.н.) ще бъде пропуснат или заменен с други справочни номера без значение. Останалата лична информация на студентите (възраст, пол и т.н.) може да присъства в списъка.
3::Имената на курсовете и получените оценки за всеки курс без каквато и да било друга информация
2::Единствено оценките на студентите без каквато и да било друга информация (дори без имената на съответните курсове)

За съжаление това не е правилният отговор. Списък с данни следва да се счита за анонимизиран, ако не е възможно да се идентифицира което и да било лице, включено в него, като се вземат предвид всички средства, които биха могли да бъдат използвани разумно от друго лице. Следователно замяната на едни справочни номера с други, макар и без значение, не е анонимизиране, а псевдонимизиране; напр. ако се знае, че само Иван е имал оценка 10 за курс A, то можем да намерим справочния номер в списъка, който съответства на Иван, а оттам и всички оценки, които той е получил във всички курсове. Дори да бъдат заличени всички уникални идентификатори, съчетание от други лични данни също може да доведе до идентификация (напр. ако знаем, че единственият мъж на 21 години е Иван).

Правилният отговор в настоящия сценарий е имената на курсовете и получените оценки за всеки курс без каквато и да било друга информация. По принцип е доста трудно да се постигне пълно анонимизиране, ако все пак намерението е да се публикува списък с полезни данни. Ако идентификаторите на лицата са чисто и просто премахнати или променени, това не е анонимизиране. Съществуват конкретни методи за анонимизиране, които публикуващата страна трябва да следва, за да отстрани няколко риска от деанонимизиране. За допълнителна информация вж. доклада на Агенцията на Европейския съюз за мрежова и информационна сигурност (ENISA) „Privacy by Design in Big Data“ („Защита на неприкосновеността на личния живот на етапа на проектирането в големите информационни масиви“): https://www.enisa.europa.eu/publications/big-data-protection

 

Това е правилният отговор. Списък с данни следва да се счита за анонимизиран, ако не е възможно да се идентифицира което и да било лице, включено в него, като се вземат предвид всички средства, които биха могли да бъдат използвани разумно от друго лице. По принцип е доста трудно да се постигне пълно анонимизиране, ако все пак намерението е да се публикува списък с полезни данни. Ако идентификаторите на лицата са чисто и просто премахнати или променени, това не е анонимизиране. Съществуват конкретни методи за анонимизиране, които публикуващата страна трябва да следва, за да отстрани няколко риска от деанонимизиране. За допълнителна информация вж. доклада на Агенцията на Европейския съюз за мрежова и информационна сигурност (ENISA) „Privacy by Design in Big Data“ („Защита на неприкосновеността на личния живот на етапа на проектирането в големите информационни масиви“): https://www.enisa.europa.eu/publications/big-data-protection

 

Това е вярно само отчасти. Действително такъв списък, който представлява единствено поредица от оценки (т.е. числа), е напълно анонимизиран, тъй като не е възможно да се идентифицира нито едно лице по него, като се вземат предвид всички средства, които биха могли да бъдат използвани разумно от друго лице. Този списък обаче не е полезен в контекста на предназначението на публикуването му (напр. не можем да изчислим средните стойности на оценките, дадени в курс A). Правилният отговор в настоящия сценарий е имената на курсовете и получените оценки за всеки курс без каквато и да било друга информация. По принцип е доста трудно да се постигне пълно анонимизиране, ако все пак намерението е да се публикува списък с полезни данни. Ако идентификаторите на лицата са чисто и просто премахнати или променени, това не е анонимизиране. Съществуват конкретни методи за анонимизиране, които публикуващата страна трябва да следва, за да отстрани няколко риска от деанонимизиране. За допълнителна информация вж. доклада на Агенцията на Европейския съюз за мрежова и информационна сигурност (ENISA) „Privacy by Design in Big Data“ („Защита на неприкосновеността на личния живот на етапа на проектирането в големите информационни масиви“): https://www.enisa.europa.eu/publications/big-data-protection



дадени на неговите студенти във всички курсове, които са предлагани в конкретна година, с цел на всички да бъде дадена възможност да обработват тези данни в научни/статистически анализи, т.е. да изчисляват средни, минимални и максимални стойности, както и друга статистическа информация относно оценките съответно за всеки курс. В съобщението си колежът заявява, че списъкът ще бъде напълно анонимизиран.

Какви данни очаквате да видите в такъв напълно анонимизиран списък?