Kurs iŞİ Fakültə : İnformasiya texnologiyaları və idarəetmə (İTİF) İxtisas : İnformasiya təhlükəsizliyi Kafedra : Kompüter mühəndisliyi kafedrası Fənnin adı : Böyük verilənlərin emalı texnologiyaları Mövzu : Verilənlərin anonimləşdirilməsi Qrup



Yüklə 213,77 Kb.
səhifə13/21
tarix05.01.2023
ölçüsü213,77 Kb.
#78475
1   ...   9   10   11   12   13   14   15   16   ...   21
Əli Kurs işi

Anonimləşdirmə üsulları
Kəmiyyət məlumatları üçün anonimləşdirmə üsullarını iki kateqoriyaya bölmək olar: ümumiləşdirmə və təsadüfiləşdirmə. Məlumatlar ümumiləşdirildikdə, məlumat geri dönməz şəkildə silinir və ya məlumat subyektlərinin atributları dəyərlərin (yenidən) kateqoriyalara bölünməsi və ya qabalaşdırılması, yəni onların miqyasının və ya böyüklük sırasının dəyişdirilməsi ilə seyreltilir. Müşahidələrin qeyri-müəyyənliyini artırmaq üçün məlumatlara "səs-küy" əlavə etmək üçün təsadüfiləşdirmə üsullarından istifadə olunur. (Cabrera 2017; Aİ-nin 29-cu maddəsi işçi qrupu: Rəy 05/2014.) Uğurlu anonimləşdirmə adətən bir neçə anonimləşdirmə texnikasının istifadəsini, həmçinin məlumatların anonimliyi və məlumatın istifadəsi arasında balansın qiymətləndirilməsini tələb edir. Bütün anonimləşdirmə üsullarının öz üstünlükləri və məhdudiyyətləri var, buna görə də onların məlumat keyfiyyətinə və istifadəyə təsirləri ilə tanış olmalısınız. Dəyişənlərin təsnifatı verilənlərdə məlumatı saxlamağa və ondan müəyyən tədqiqat metodları ilə istifadə etməyə imkan verir. Kateqoriyalar məlumatın istifadəsini azaldır, lakin bir qədər (Purdam & Elliot 2007). Bununla belə, anonimlik baxımından müəssisənin yenidən kodlaşdırıldıqdan sonra hələ də müəyyən bir kateqoriya ilə əlaqələndirilə bilməsi problemlidir (Aİ-nin 29-cu maddəsi işçi qrupu: Rəy 05/2014). Üstəlik, dəyişənin bütün dəyərlərini kateqoriyalara ayırmaq dəyişənlər arasında əlaqələri müəyyən etməyi çətinləşdirə və davamlı dəyişənlər üçün nəzərdə tutulmuş müəyyən məlumat təhlili üsullarının istifadəsinin qarşısını ala bilər (Anguli, Blitzstein & Waldo 2015). Məlumatlarda nisbətən az nadir müşahidələr olduqda (bir faizdən az) təsadüfiləşdirmə faydalı ola bilər. Bununla belə, təsadüfiləşdirmə üsullarından istifadə edərkən, texnikanın məlumatların keyfiyyətinə təsirini diqqətlə qiymətləndirməlisiniz. Təsadüfiləşdirmə üsulları, məsələn, dəyişənlərin tezlik paylanmasına və korrelyasiya və səbəbiyyətin təhlilinə əhəmiyyətli təsir göstərə bilər. Bunlar da öz növbəsində tədqiqat nəticələrinə təsir göstərir. Bəzi tədqiqatçılar müxtəlif təsadüfiləşdirmə üsullarını məlumatların təhrif edilməsini hesab etsələr də, onlar çox vaxt anonimləşdirmədə faydalıdır.
Aşağıdakı bölmələrdə biz ən ümumi ümumiləşdirmə və təsadüfiləşdirmə üsullarını təqdim edirik. Ümumiləşdirmə üsullarına məlumatı istisna etmək, kateqoriyalara ayırmaq və qabalaşdırmaq, bütün verilənlər əvəzinə nümunələrdən istifadə etmək, k-anonimləşdirmə və l-müxtəliflik daxildir. Təsadüfi üsullar vurma və dəyişmə vasitəsilə dəyişənlərin dəqiq qiymətlərini gizlədir.
Texnikalar:

  1. Dəyişənlərin, dəyərlərin və müşahidə vahidlərinin silinməsi

  2. Dəyişən dəyərlərin yenidən kodlanması

  3. Açıq uçlu dəyişənlərdə cavabların redaktə edilməsi

  4. K-anonimlik və l-müxtəliflik

  5. Səs əlavəsi

  6. Permutasiya


Yüklə 213,77 Kb.

Dostları ilə paylaş:
1   ...   9   10   11   12   13   14   15   16   ...   21




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©azkurs.org 2024
rəhbərliyinə müraciət

gir | qeydiyyatdan keç
    Ana səhifə


yükləyin