August 18, 2025
4 min read
Phân tích dữ liệu được ẩn danh theo GDPR cho thấy dữ liệu được coi là ẩn danh khi nó được “trở nên ẩn danh theo cách mà chủ thể dữ liệu không hoặc không còn có thể nhận dạng được” (GDPR, Đoạn 26). Tiêu chuẩn này đã được làm rõ bởi Nhóm công tác Điều 29, nhóm này nhấn mạnh rằng việc ẩn danh phải không thể đảo ngược và “nguy cơ nhận dạng lại phải không đáng kể” (WP29 Ý kiến 05/2014).
Những phát hiện chính:
Kỹ thuật ẩn danh:
Các phương pháp phổ biến bao gồm tổng hợp, che dữ liệu và ngẫu nhiên hóa. Tuy nhiên, việc ẩn danh thực sự đòi hỏi không có quy trình nào trong số này để lại bất kỳ khả năng nhận dạng lại nào, ngay cả khi được kết hợp với các bộ dữ liệu có thể truy cập khác (Ohm, 2010).
Tình trạng pháp lý:
Dữ liệu đã được ẩn danh không thuộc định nghĩa về dữ liệu cá nhân và do đó không tuân theo các hạn chế của GDPR (GDPR, Điều 4(1)).
“Thông tin không liên quan đến một thể nhân đã được xác định hoặc có thể xác định được hoặc dữ liệu cá nhân được ẩn danh theo cách mà chủ thể dữ liệu không hoặc không còn có thể nhận dạng được” không phải là dữ liệu cá nhân (GDPR Đoạn 26).
Những thách thức thực tế:
Các nhà nghiên cứu cho rằng việc ẩn danh tuyệt đối hiếm khi có thể đạt được do những tiến bộ trong phân tích dữ liệu và sự sẵn có ngày càng tăng của dữ liệu phụ trợ. Narayanan và Shmatikov (2008) đã chứng minh rằng các bản ghi xem Netflix đã được loại bỏ định danh có thể được nhận dạng lại bằng cách liên kết với các xếp hạng của IMDb.
Rủi ro nhận dạng lại:
Rủi ro tăng lên khi các bộ dữ liệu phong phú hoặc khi những kẻ tấn công sở hữu thông tin nền. GDPR yêu cầu một bài kiểm tra “khả năng hợp lý”: nếu việc nhận dạng là “có khả năng hợp lý”, dữ liệu không nên được coi là đã ẩn danh.
Bút danh hóa và ẩn danh hóa:
GDPR phân biệt giữa hai loại này:
Kết quả cho thấy:
Tóm lại, dữ liệu được ẩn danh theo GDPR có nghĩa là thông tin đã được loại bỏ định danh một cách không thể đảo ngược, trong đó khả năng nhận dạng là không thể bằng bất kỳ phương tiện nào “có khả năng hợp lý được sử dụng”. Tuy nhiên, do các mối đe dọa đang phát triển, việc đánh giá liên tục các quy trình ẩn danh là rất cần thiết.