August 18, 2025
3 min read
Analiza datelor anonimizate în conformitate cu GDPR relevă că datele sunt considerate anonimizate atunci când sunt “prelucrate într-o asemenea manieră încât persoana vizată să nu fie sau să nu mai poată fi identificată” (GDPR, Considerentul 26). Acest standard a fost clarificat de Grupul de lucru „Articolul 29”, care a subliniat că anonimizarea trebuie să fie ireversibilă și că “riscul de reidentificare trebuie să fie neglijabil” (Avizul 05/2014 al GL29).
Constatări cheie:
Tehnici de anonimizare:
Metodele comune includ agregarea, mascarea datelor și randomizarea. Cu toate acestea, anonimizarea reală necesită ca niciunul dintre aceste procese să nu lase vreo posibilitate de reidentificare, chiar și atunci când sunt combinate cu alte seturi de date accesibile (Ohm, 2010).
Statut juridic:
Datele anonimizate nu intră în definiția datelor cu caracter personal și, prin urmare, nu sunt supuse restricțiilor GDPR (GDPR, Art. 4(1)).
“Informațiile care nu se referă la o persoană fizică identificată sau identificabilă sau la date cu caracter personal anonimizate astfel încât persoana vizată să nu fie sau să nu mai poată fi identificată” nu sunt date cu caracter personal (Considerentul 26 al GDPR).
Provocări practice:
Cercetătorii susțin că anonimizarea absolută este rareori realizabilă din cauza progreselor în analiza datelor și a disponibilității tot mai mari a datelor auxiliare. Narayanan și Shmatikov (2008) au demonstrat că înregistrările de vizionare de-identificate de pe Netflix au putut fi reidentificate prin corelarea cu evaluările de pe IMDb.
Riscul de reidentificare:
Riscul crește atunci când seturile de date sunt bogate sau când atacatorii dețin informații de fond. GDPR impune un test al “probabilității rezonabile”: dacă identificarea este “rezonabil probabilă,” datele nu ar trebui considerate anonimizate.
Pseudonimizare vs. anonimizare:
GDPR face distincția între cele două:
Rezultatele indică:
În concluzie, datele anonimizate în conformitate cu GDPR înseamnă informații de-identificate ireversibil, unde identificabilitatea nu este posibilă prin niciun mijloc “rezonabil probabil de a fi utilizat”. Cu toate acestea, din cauza amenințărilor în evoluție, evaluarea continuă a proceselor de anonimizare este esențială.