Una universidad anuncia la próxima publicación en su sitio web de un conjunto de datos con las notas (calificaciones globales) obtenidas por sus alumnos en todas las asignaturas ofertadas en un determinado año académico,


1::El nombre de las asignaturas y la nota obtenida por cada alumno en cada asignatura. Se omitirán todos los identificadores del alumno (por ejemplo, el nombre, el número de identificación del alumno, etc.) o se habrán sustituido por otros números de referencia que carezcan de significado. Puede que la lista incluya otra información personal de los alumnos, como la edad o el sexo.
3::El nombre de las asignaturas y las notas obtenidas en cada una de ellas, sin ninguna información adicional.
2::Solo las notas obtenidas por los alumnos, sin ninguna información adicional (ni siquiera las asignaturas correspondientes).

Lamentablemente, esta no es la respuesta correcta. Una lista de datos debería considerarse anonimizada si no es posible identificar a ninguna persona de la lista, teniendo en cuenta todos los medios que razonablemente pueda utilizar cualquier otra persona. Por tanto, sustituir identificadores por otros números de referencia que carezcan de significado no constituye una anonimización, sino una seudonimización; por ejemplo, si sabemos que John es el único que ha sacado un 10 en la asignatura A, podemos averiguar el número de referencia asignado a John en la lista y, de este modo, conocer las notas que ha obtenido en todas las asignaturas. Incluso en el caso de que nos limitemos a omitir todos los identificadores únicos, la combinación de otra información personal también podría dar lugar a la identificación del alumno (por ejemplo, si sabemos que John es el único alumno con 21 años de edad).

 

La respuesta correcta en este supuesto es el nombre de las asignaturas y las notas obtenidas en cada una de ellas, sin ninguna información adicional. En general, resulta muy difícil lograr una anonimización completa cuando se va a publicar una lista con datos útiles. La mera eliminación o modificación de los identificadores de las personas no supone una anonimización. Existen métodos específicos de anonimización que el responsable de la publicación debería aplicar para abordar los posibles riesgos de «desanonimización». Para más información, véase el informe de la ENISA sobre privacidad desde el diseño en los macrodatos: https://www.enisa.europa.eu/publications/big-data-protection.

 

Esta es la respuesta correcta. Una lista de datos debería considerarse anonimizada si no es posible identificar a ninguna persona de la lista, teniendo en cuenta todos los medios que razonablemente pueda utilizar cualquier otra persona. En general, resulta muy difícil lograr una anonimización completa cuando se va a publicar una lista con datos útiles. La mera eliminación o modificación de los identificadores de las personas no supone una anonimización. Existen métodos específicos de anonimización que el responsable de la publicación debería aplicar para abordar los posibles riesgos de «desanonimización». Para más información, véase el informe de ENISA sobre privacidad desde el diseño en los macrodatos: https://www.enisa.europa.eu/publications/big-data-protection.

 

Esto es solo parcialmente correcto. En efecto, esta lista, que sería una simple lista de notas (es decir, de números) estaría totalmente anonimizada, ya que no sería posible identificar a ninguna persona de la lista, teniendo en cuenta todos los medios que razonablemente pueda utilizar cualquier otra persona. Sin embargo, no sería una lista útil en el contexto de la finalidad prevista de la publicación (por ejemplo, no se podrían calcular las medias de las notas obtenidas en la asignatura A). La respuesta correcta en este supuesto es el nombre de las asignaturas y las notas obtenidas en cada una de ellas, sin ninguna información adicional. En general, resulta muy difícil lograr una anonimización completa cuando se va a publicar una lista con datos útiles. La mera eliminación o modificación de los identificadores de las personas no supone una anonimización. Existen métodos específicos de anonimización que el responsable de la publicación debería aplicar para abordar los posibles riesgos de «desanonimización». Para más información, véase el informe de ENISA sobre privacidad desde el diseño en los macrodatos: https://www.enisa.europa.eu/publications/big-data-protection.



con el fin de que todo el mundo pueda utilizarlas en análisis científicos o estadísticos para calcular las medias, así como los valores máximos y mínimos y otra información estadística sobre las notas correspondientes a cada asignatura. La universidad declara que la lista estará totalmente anonimizada. 

¿Qué datos cree usted que incluirá esta lista totalmente anonimizada?