دادههای مستعار به اطلاعاتی اطلاق میشود که شناسههای شخصی از آنها حذف، جایگزین یا به گونهای تبدیل شدهاند که انتساب مستقیم به یک فرد بدون اطلاعات اضافی و ذخیرهشده جداگانه، ممکن نباشد. این فرآیند شناسههای مستقیم (مانند نامها، شمارههای شناسایی) را با نشانگرهای مصنوعی مانند کدها یا نامهای مستعار جایگزین میکند. بر اساس ماده ۴ (۵) مقررات عمومی حفاظت از دادهها (GDPR)، مستعارسازی عبارت است از پردازش دادههای شخصی به گونهای که دیگر نتوان آنها را بدون استفاده از اطلاعات تکمیلی به یک فرد خاص نسبت داد؛ این اطلاعات تکمیلی باید به صورت جداگانه و ایمن نگهداری شوند (Voigt & Von dem Bussche, 2017).
نتایج نشان میدهند:
- مستعارسازی خطر شناسایی غیرمجاز و سوءاستفاده از دادهها را کاهش میدهد.
- برخلاف دادههای ناشناس، که به طور برگشتناپذیر از همه شناسهها پاک میشوند، دادههای مستعار پتانسیل شناسایی مجدد را از طریق یک «کلید» کنترلشده یا مجموعه داده تکمیلی حفظ میکنند.
- روشهای مؤثر مستعارسازی عبارتند از:
- جایگزینی نامها با کدهای منحصر به فرد
- پوشاندن یا درهمسازی (hashing) فیلدهای حساس
- استفاده از توکنیزاسیون (tokenization) برای شناسههای پرخطر
مثال: “Patient_12345” به جای “Jane Doe.”
نکات برجسته بحث:
- انطباق با حفاظت از دادهها: مستعارسازی به عنوان یک اقدام حفاظتی تحت GDPR و سایر چارچوبهای حریم خصوصی شناخته میشود و به سازمانها این امکان را میدهد که اطلاعات شخصی را پردازش کنند و در عین حال با الزامات به حداقل رساندن دادهها و امنیت مطابقت داشته باشند (GDPR Recital 29).
- مدیریت ریسک شناسایی مجدد: در حالی که دادههای مستعار حریم خصوصی را تقویت میکنند، اما در صورت دسترسی به کلید یا فایل نگاشت، در برابر شناسایی مجدد مصون نیستند. بنابراین، تفکیک دقیق و پروتکلهای امنیتی برای اطلاعات تکمیلی ضروری است (Narayanan & Shmatikov, 2008).
- تحقیق و تحلیل: مجموعه دادههای مستعار امکان تحلیلهای آماری معنادار یا مطالعات طولی را بدون افشای جزئیات قابل شناسایی فراهم میکنند. به عنوان مثال، تحقیقات پزشکی اغلب برای ایجاد تعادل بین سودمندی علمی و محرمانگی، به سوابق مستعار بیماران متکی است (El Emam & Arbuckle, 2013).
- محدودیتها: اثربخشی مستعارسازی به قدرت روش و میزان وجود شناسههای غیرمستقیم بستگی دارد. مستعارسازی ضعیف ممکن است همچنان دادهها را در برابر حملات پیوندی یا استنتاج در صورت ترکیب با مجموعه دادههای کمکی، آسیبپذیر باقی بگذارد.
به طور خلاصه، دادههای مستعار به عنوان یک راه میانه بین دادههای قابل شناسایی و ناشناس عمل میکنند و ضمن حفظ ارزش تحلیلی، حفاظت از حریم خصوصی را افزایش میدهند. کاربرد آن به شدت به مدیریت کلید امن و کنترلهای فنی قوی برای کاهش خطرات شناسایی مجدد وابسته است.