\ AEPD - 10 Malentendidos relacionados con la anonimización
La anonimización es el proceso mediante el cual los datos personales se convierten en anónimos.
Fuente: AEPD
De
conformidad con la legislación en materia de protección de datos de la Unión
Europea, en concreto, el Reglamento general de protección de datos (RGPD), los
datos anónimos constituyen «aquella información que no hace referencia a
personas naturales identificadas o identificables o a datos personales que se
anonimizan de tal forma que dejan de ser identificables». Los conjuntos de
datos que incluyen datos personales pueden contener identificadores directos e
indirectos, lo que permite que se identifique o que pueda identificarse a una
persona física. Un identificador directo es la información específica que puede
atribuirse a un individuo, como su nombre o un número de identificación. Un
identificador indirecto (también denominado cuasi-identificador) es cualquier
dato (por ejemplo, una situación geográfica en un momento determinado o una
opinión sobre un tema en particular) que podría utilizarse, ya sea de forma
individual o combinada con otros cuasi-identificadores, por alguien que posea
conocimientos sobre ese individuo con el fin de reidentificarle en el conjunto
de datos. La probabilidad de reidentificación es la probabilidad de que se
reidentifique a un individuo en un conjunto de datos determinado mediante la
conversión de datos anonimizados en datos personales a través del uso de la
comparación de datos o de técnicas similares. La utilidad de un conjunto de
datos es una unidad que mide la utilidad de esa información para un propósito
determinado (por ejemplo, un estudio de investigación sobre una enfermedad
específica).
A lo
largo de los años, ha habido varios ejemplos de procesos de anonimización que
se han llevado a cabo de forma incompleta o errónea, lo que supone la
reidentificación de los individuos. Por ejemplo, en 2006 un servicio de
visionado en streaming de películas publicó un conjunto de datos que contenía
10 millones de clasificaciones de películas realizadas por 500 000 clientes
alegando que era anónimo, pero posteriormente se descubrió que era suficiente
con saber unos pocos datos sobre el suscriptor para poder identificarlo en el
registro de ese conjunto de datos. Otro ejemplo de anonimización deficiente: en
2013, la Comisión de Taxis y Limusinas de la ciudad de Nueva York publicó una
ficha de datos con más de 173 millones de viajes individuales en taxi que
contenían la ubicación de recogida y destino, los horarios y los números de
licencia supuestamente anonimizados. El conjunto de datos no se anonimizó de
forma correcta, con lo cual, era posible identificar los números de licencia
originales e, incluso, a los conductores de dichos taxis.
Los
datos anónimos desempeñan un papel importante en el contexto de la
investigación en áreas como la medicina, demografía, marketing, economía,
estadística y muchas otras. Sin embargo, este interés ha supuesto la difusión
de malentendidos al respecto. El objetivo del presente documento es
sensibilizar al público sobre algunos malentendidos relacionados con la anonimización
y motivar a sus lectores para que comprueben las afirmaciones sobre la
tecnología, en lugar de aceptarlas sin una verificación.
El
presente documento incluye una lista de diez de estos malentendidos, explica la
realidad y ofrece referencias para una lectura pormenorizada.