Noticias \ AEPD - 10 Malentendidos relacionados con la anonimización


La anonimización es el proceso mediante el cual los datos personales se convierten en anónimos.

Fuente: AEPD

De conformidad con la legislación en materia de protección de datos de la Unión Europea, en concreto, el Reglamento general de protección de datos (RGPD), los datos anónimos constituyen «aquella información que no hace referencia a personas naturales identificadas o identificables o a datos personales que se anonimizan de tal forma que dejan de ser identificables». Los conjuntos de datos que incluyen datos personales pueden contener identificadores directos e indirectos, lo que permite que se identifique o que pueda identificarse a una persona física. Un identificador directo es la información específica que puede atribuirse a un individuo, como su nombre o un número de identificación. Un identificador indirecto (también denominado cuasi-identificador) es cualquier dato (por ejemplo, una situación geográfica en un momento determinado o una opinión sobre un tema en particular) que podría utilizarse, ya sea de forma individual o combinada con otros cuasi-identificadores, por alguien que posea conocimientos sobre ese individuo con el fin de reidentificarle en el conjunto de datos. La probabilidad de reidentificación es la probabilidad de que se reidentifique a un individuo en un conjunto de datos determinado mediante la conversión de datos anonimizados en datos personales a través del uso de la comparación de datos o de técnicas similares. La utilidad de un conjunto de datos es una unidad que mide la utilidad de esa información para un propósito determinado (por ejemplo, un estudio de investigación sobre una enfermedad específica).

A lo largo de los años, ha habido varios ejemplos de procesos de anonimización que se han llevado a cabo de forma incompleta o errónea, lo que supone la reidentificación de los individuos. Por ejemplo, en 2006 un servicio de visionado en streaming de películas publicó un conjunto de datos que contenía 10 millones de clasificaciones de películas realizadas por 500 000 clientes alegando que era anónimo, pero posteriormente se descubrió que era suficiente con saber unos pocos datos sobre el suscriptor para poder identificarlo en el registro de ese conjunto de datos. Otro ejemplo de anonimización deficiente: en 2013, la Comisión de Taxis y Limusinas de la ciudad de Nueva York publicó una ficha de datos con más de 173 millones de viajes individuales en taxi que contenían la ubicación de recogida y destino, los horarios y los números de licencia supuestamente anonimizados. El conjunto de datos no se anonimizó de forma correcta, con lo cual, era posible identificar los números de licencia originales e, incluso, a los conductores de dichos taxis.

Los datos anónimos desempeñan un papel importante en el contexto de la investigación en áreas como la medicina, demografía, marketing, economía, estadística y muchas otras. Sin embargo, este interés ha supuesto la difusión de malentendidos al respecto. El objetivo del presente documento es sensibilizar al público sobre algunos malentendidos relacionados con la anonimización y motivar a sus lectores para que comprueben las afirmaciones sobre la tecnología, en lugar de aceptarlas sin una verificación.

El presente documento incluye una lista de diez de estos malentendidos, explica la realidad y ofrece referencias para una lectura pormenorizada.


DP-CONTROL Huelva

Avda. de Andalucia, 2
21004 HUELVA
Tlno: 959 821 386
Tlno: 959 821 387

DP-CONTROL Madrid

C/ Zurbano 45
28010 MADRID
Tlno: 911 841 915
Tlno: 911 853 111

DP-CONTROL Sevilla Centro

Po. de las Delicias, 1
41001 SEVILLA
Tlno: 955 661 075
Fax: 954 560 857