Tezin Türü: Doktora
Tezin Yürütüldüğü Kurum: İstanbul Üniversitesi-Cerrahpaşa, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Türkiye
Tezin Onay Tarihi: 2021
Tezin Dili: Türkçe
Öğrenci: Merve Kanmaz
Asıl Danışman (Eş Danışmanlı Tezler İçin): Ahmet Sertbaş
Eş Danışman: Muhammed Ali Aydın
Özet:
Teknolojinin hızlı gelişimi ve hayatımızın her alanına girmesi sonucunda verinin hacmi ve değeri oldukça önemli bir çalışma alanı olmuştur. Verinin bu denli kıymetlenmesi kişilerin bilgileri açısından bazı sonuçlar doğurmuştur. Veri kimliksizleştirme, kişisel verilerin güvenliği açısından bu konulardan en önemlisidir. Bu alanda birçok çalışma yapılmıştır ve yapılmaya devam edilmektedir. Bu çalışmada ise hassas niteliklerin kimliksizleştirilmesi için RSUGP isimli bir yöntem önerilmiştir. Geometrik veri pertürbasyonunda klasik olarak kullanılan gauss gürültüsü ya da rasgele gürültü yöntemlerinin yerine rasgele sayı üreteçlerine bağlı yeni bir gürültü modeli önerilmiştir. Önerilen RSUGP yöntemi Hadoop dosya sistemi HDFS üzerinde tutulan veri setlerinin Apache Spark ile işlenmesi sonrasında sınıflandırma doğruluğu, F- ölçütü, atak dayanıklılığı açısından 6 farklı veri tabanı ve 4 farklı sınıflandırma yöntemi ile test edilmiş, bulgular sonuçlar kısmında paylaşılmıştır. Sonuçlar önerilen yöntemin sınıflandırma doğruluğu, atak dayanıklılığı ve çalışma zamanı açısından kıyaslanan diğer yöntemlere göre daha başarılı olduğunu ortaya koymuştur.