Uczelnia ogłasza, że zamieści na swojej stronie internetowej zbiór danych zawierający oceny (łączną punktację), uzyskane przez wszystkich jej studentów ze wszystkich przedmiotów w danym roku


1::Nazwy przedmiotów, a dla każdego z nich oceny wystawione każdemu studentowi. Wszystkie dane identyfikacyjne studenta (np. imię i nazwisko, numer albumu itp.) zostaną usunięte lub zastąpione innymi pozbawionymi znaczenia numerami. Na liście mogą znaleźć się inne dane osobowe studentów (wiek, płeć itp.).
3::Nazwy przedmiotów i dla każdego z nich wystawione oceny, bez żadnych innych informacji.
2::Tylko oceny wystawione studentom; żadne inne informacje (nawet o przedmiotach).

Niestety, nie jest to prawidłowa odpowiedź. Listę danych można uznać za anonimową (zanonimizowaną), jeżeli nie jest możliwe ustalenie tożsamości żadnej osoby z listy żadną metodą, jaką z racjonalnym prawdopodobieństwem może posłużyć się inna osoba. Stąd zastąpienie danych pozbawionymi znaczenia numerami nie jest anonimizacją, lecz pseudonimizacją; np. wiedząc, że tylko Jan uzyskał 10 punktów z przedmiotu A, możemy odnaleźć na liście jego numer identyfikacyjny, a następnie wszystkie oceny, które uzyskał z wszystkich przedmiotów. Nawet w przypadku usunięcia wszystkich niepowtarzalnych identyfikatorów, do identyfikacji może doprowadzić kombinacja innych danych osobowych (np. jeśli wiemy, że Jan jest jedynym mężczyzną w wieku 21 lat).

 

Prawidłowa odpowiedź w tym scenariuszu to: nazwy przedmiotów, a dla każdego z nich wystawione oceny, bez żadnych innych informacji. Na ogół dosyć trudno jest zapewnić pełną anonimizację wówczas, gdy konieczne jest opublikowanie wykazu zawierającego rzeczywiście przydatne dane. Samo usunięcie lub zmiana danych identyfikacyjnych osób nie są równoznaczne z anonimizacją. Istnieją szczególne metody anonimizacji, których powinien używać publikujący, żeby zapobiec ryzyku deanonimizacji. Dalsze informacje można znaleźć w sprawozdaniu ENISA dotyczącym ochrony prywatności w fazie projektowania w odniesieniu do dużych zbiorów danych: https://www.enisa.europa.eu/publications/big-data-protection

 

To poprawna odpowiedź. Listę danych można uznać za anonimową (zanonimizowaną), jeżeli nie jest możliwe ustalenie tożsamości żadnej osoby z listy żadną metodą, jaką z racjonalnym prawdopodobieństwem może posłużyć się inna osoba. Na ogół dosyć trudno jest zapewnić pełną anonimizację wówczas, gdy konieczne jest opublikowanie wykazu zawierającego rzeczywiście przydatne dane. Samo usunięcie lub zmiana danych identyfikacyjnych osób nie są równoznaczne z anonimizacją. Istnieją szczególne metody anonimizacji, których powinien używać publikujący, żeby zapobiec ryzyku deanonimizacji. Dalsze informacje można znaleźć w sprawozdaniu ENISA dotyczącym ochrony prywatności w fazie projektowania w odniesieniu do dużych zbiorów danych:https://www.enisa.europa.eu/publications/big-data-protection

 

Ta odpowiedź jest tylko częściowo poprawna. Rzeczywiście taka prosta lista ocen (czyli liczb) jest w pełni anonimowa, ponieważ nie pozwala na ustalenie tożsamości żadnej osoby z listy żadną metodą, jakiej z racjonalnym prawdopodobieństwem może użyć inna osoba. Nie jest ona jednak przydatna w kontekście przewidywanego celu opublikowania (np. nie można za jej pomocą obliczyć średnich ocen z przedmiotu A). Prawidłowa odpowiedź w tym scenariuszu to: nazwy przedmiotów, a dla każdego z nich wystawione oceny, bez żadnych innych informacji. Na ogół dosyć trudno jest zapewnić pełną anonimizację wówczas, gdy konieczne jest opublikowanie wykazu zawierającego rzeczywiście przydatne dane. Samo usunięcie lub zmiana danych identyfikacyjnych osób nie są równoznaczne z anonimizacją. Istnieją szczególne metody anonimizacji, których powinien używać publikujący, żeby zapobiec ryzyku deanonimizacji. Dalsze informacje można znaleźć w sprawozdaniu ENISA dotyczącym ochrony prywatności w fazie projektowania w odniesieniu do dużych zbiorów danych:https://www.enisa.europa.eu/publications/big-data-protection

 


tak by umożliwić wszystkim zainteresowanym dalsze przetwarzanie danych w celu przeprowadzenia analiz naukowych/statystycznych, tj. obliczenia wartości średnich oraz maksymalnych i minimalnych, a także uzyskania innych danych statystycznych o ocenach z poszczególnych przedmiotów. Uczelnia informuje w ogłoszeniu, że lista będzie w pełni anonimowa.

 

Jakie dane spodziewasz się znaleźć na tej w pełni anonimowej liście?