Ένα κολλέγιο ανακοινώνει ότι ένα σύνολο δεδομένων θα δημοσιευτεί στον ιστότοπό του, το οποίο θα περιέχει τους βαθμούς (συνολική βαθμολογία) των σπουδαστών σε όλα τα μαθήματα ενός συγκεκριμένου έτους·


1::Τους τίτλους των μαθημάτων και, για κάθε μάθημα, τον βαθμό που έλαβε κάθε σπουδαστής. Οποιοδήποτε αναγνωριστικό των σπουδαστών (π.χ. ονοματεπώνυμο, αριθμός μητρώου σπουδαστή κ.λπ.) θα παραλειφθεί ή θα αντικατασταθεί από άλλους αριθμούς αναφοράς χωρίς νόημα. Άλλα στοιχεία προσωπικού χαρακτήρα των σπουδαστών (ηλικία, φύλο κ.λπ.) μπορούν να περιλαμβάνονται στον κατάλογο.
3::Οι τίτλοι των μαθημάτων και, για κάθε μάθημα, οι βαθμοί που δόθηκαν χωρίς καμία άλλη πληροφορία.
2::Μόνον οι βαθμοί που δόθηκαν στους σπουδαστές· καμία άλλη πληροφορία (ούτε καν τα αντίστοιχα μαθήματα)

Δυστυχώς, δεν είναι αυτή η σωστή απάντηση. Ένας κατάλογος δεδομένων θα πρέπει να θεωρείται ανωνυμοποιημένος εάν δεν είναι δυνατόν να ταυτοποιηθεί κανένα από τα άτομα που περιλαμβάνονται σε αυτόν, λαμβανομένων υπόψη όλων των μέσων που μπορούν εύλογα να χρησιμοποιηθούν από οποιονδήποτε τρίτο. Επομένως, η αντικατάσταση των αναγνωριστικών με άλλους αριθμούς αναφοράς που δεν έχουν νόημα δεν θεωρείται ανωνυμοποίηση αλλά ψευδωνυμία· π.χ. εάν κάποιος γνωρίζει ότι μόνον ο Γιάννης πήρε 10 στο μάθημα Α, μπορεί να βρει τον αριθμό αναφοράς του καταλόγου που αντιστοιχεί στον Γιάννη και, στη συνέχεια, όλους τους βαθμούς που πήρε ο Γιάννης σε όλα τα μαθήματα. Ακόμη και αν παραλειφθούν απλώς όλα τα μοναδικά αναγνωριστικά, ο συνδυασμός άλλων πληροφοριών προσωπικού χαρακτήρα μπορεί να οδηγήσει και πάλι σε ταυτοποίηση (π.χ. εάν γνωρίζουμε ότι ο μόνος άνδρας ηλικίας 21 ετών είναι ο Γιάννης).

 

Η σωστή απάντηση στο σενάριο αυτό είναι οι τίτλοι των μαθημάτων και, για κάθε μάθημα, οι βαθμοί που δόθηκαν χωρίς καμία άλλη πληροφορία. Γενικά, είναι αρκετά δύσκολο να επιτευχθεί η πλήρης ανωνυμοποίηση, όταν ο σκοπός είναι να δημοσιευθεί ένας κατάλογος που περιέχει χρήσιμα δεδομένα. Η απλή παράλειψη ή αλλαγή των αναγνωριστικών των προσώπων δεν σημαίνει ανωνυμοποίηση. Υπάρχουν συγκεκριμένες μέθοδοι ανωνυμοποίησης τις οποίες θα πρέπει να εφαρμόζουν όσοι δημοσιεύουν στοιχεία, προκειμένου να αντιμετωπίζονται διάφοροι κίνδυνοι απο-ανωνυμοποίησης. Για περισσότερες πληροφορίες βλέπε την έκθεση του ENISA σχετικά με την προστασία της ιδιωτικής ζωής ήδη από τον σχεδιασμό στα μαζικά δεδομένα: https://www.enisa.europa.eu/publications/big-data-protection

 

Αυτή είναι η σωστή απάντηση. Ένας κατάλογος δεδομένων θα πρέπει να θεωρείται ανωνυμοποιημένος εάν δεν είναι δυνατόν να ταυτοποιηθεί κανένα από τα άτομα που περιλαμβάνονται σε αυτόν, λαμβανομένων υπόψη όλων των μέσων που μπορούν εύλογα να χρησιμοποιηθούν από οποιονδήποτε τρίτο. Γενικά, είναι αρκετά δύσκολο να επιτευχθεί η πλήρης ανωνυμοποίηση, όταν ο σκοπός είναι να δημοσιευθεί ένας κατάλογος που περιέχει χρήσιμα δεδομένα. Η απλή παράλειψη ή αλλαγή των αναγνωριστικών των προσώπων δεν σημαίνει ανωνυμοποίηση. Υπάρχουν συγκεκριμένες μέθοδοι ανωνυμοποίησης τις οποίες θα πρέπει να εφαρμόζουν όσοι δημοσιεύουν στοιχεία, προκειμένου να αντιμετωπίζονται διάφοροι κίνδυνοι απο-ανωνυμοποίησης. Για περισσότερες πληροφορίες βλέπε την έκθεση του ENISA σχετικά με την προστασία της ιδιωτικής ζωής ήδη από τον σχεδιασμό στα μαζικά δεδομένα: https://www.enisa.europa.eu/publications/big-data-protection

 

Αυτό είναι μόνον εν μέρει σωστό. Πράγματι, αυτός ο κατάλογος, ο οποίος είναι ένας απλός κατάλογος βαθμολογίας (περιλαμβάνει, δηλαδή, αριθμούς) είναι πλήρως ανωνυμοποιημένος, καθώς δεν είναι δυνατή η ταυτοποίηση κανενός προσώπου, λαμβανομένων υπόψη όλων των μέσων που μπορούν εύλογα να χρησιμοποιηθούν από οποιονδήποτε τρίτο. Ωστόσο, δεν είναι ένας χρήσιμος κατάλογος για τον επιδιωκόμενο σκοπό της δημοσίευσης (π.χ. δεν είναι δυνατός ο υπολογισμός του μέσου όρου των βαθμών που δόθηκαν στο μάθημα Α). Η σωστή απάντηση στο σενάριο αυτό είναι οι τίτλοι των μαθημάτων και, για κάθε μάθημα, οι βαθμοί που δόθηκαν χωρίς καμία άλλη πληροφορία. Γενικά, είναι αρκετά δύσκολο να επιτευχθεί η πλήρης ανωνυμοποίηση, όταν ο σκοπός είναι να δημοσιευθεί ένας κατάλογος που περιέχει χρήσιμα δεδομένα. Η απλή παράλειψη ή αλλαγή των αναγνωριστικών των προσώπων δεν σημαίνει ανωνυμοποίηση. Υπάρχουν συγκεκριμένες μέθοδοι ανωνυμοποίησης τις οποίες θα πρέπει να εφαρμόζουν όσοι δημοσιεύουν στοιχεία, προκειμένου να αντιμετωπίζονται διάφοροι κίνδυνοι απο-ανωνυμοποίησης. Για περισσότερες πληροφορίες βλέπε την έκθεση του ENISA σχετικά με την προστασία της ιδιωτικής ζωής ήδη από τον σχεδιασμό στα μαζικά δεδομένα: https://www.enisa.europa.eu/publications/big-data-protection



σκοπός είναι να δοθεί σε όλους η δυνατότητα περαιτέρω επεξεργασίας των στοιχείων αυτών για επιστημονική/στατιστική ανάλυση, δηλαδή για τον υπολογισμό μέσων τιμών, καθώς και μέγιστων και ελάχιστων τιμών και άλλων στατιστικών στοιχείων σχετικά με τους βαθμούς που αντιστοιχούν σε κάθε μάθημα. Το κολλέγιο αναφέρει στην ανακοίνωσή του ότι ο κατάλογος θα είναι πλήρως ανωνυμοποιημένος. 

Τι είδους δεδομένα περιμένετε να δείτε σε έναν τέτοιον πλήρως ανωνυμοποιημένο κατάλογο;