MEFV GEN VARYANTLARININ SINIFLANDIRILMASI ESNASINDA ORTAYA ÇIKAN BELİRSİZLİKLERİN YAPAY ZEKA ALGORİTMALARIYLA ÇÖZÜMLENMESİ


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: İstanbul Üniversitesi-Cerrahpaşa, Cerrahpaşa Tıp Fakültesi, Temel Tıp Bilimleri Bölümü, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: Mustafa Tarık Alay

Danışman: Murat Kirişci

Özet:

Giriş: Ailevi Akdeniş Ateşi(FMF), ataklar halinde seyreden tekrarlayan ateş ve seröz dokularda enflamasyonla karakterize MEFV genindeki fonksiyon kazandırıcı mutasyonlar kaynaklı olarak meydana gelen  otoinflamatuar bir hastalıktır. Bildirilen MEFV gen varyantlarının yarıdan fazlasının klinik önemi bilinmemektedir. Makine öğrenmesi klinik önemi belirlenemeyen varyantların sınıflandırılmasında önemli faydalar sağlayabilir.

            Materyal-Method: Infevers veri tabanında yer alan MEFV missense ve sessiz 266 varyant dört kategoriye ayrıldı: olası patojenik (LP), olası benign (LB), unresolved, önemi bilinmeyen varyant. Eğitim verisi olarak LP ve LB varyantlar seçildi. Diğer varyantlar belirsiz olarak kabul edildi ve test verisi olarak tercih edildi. Revel, SIFT, MetaLR ve FATHMM skorları 7 makine öğrenmesi yöntemine tabi tutuldu. Tutulan skorlar makine öğrenmesi tahminlerine göre basamaklı bir değerlendirmeye göre değerlendirildi. Buna göre 4 ve 5 puan alanlar belirsiz geri kalanlar ise doğru sınıflandırılmış  olarak kabul edildi.

Giriş: Ailevi Akdeniş Ateşi(FMF), ataklar halinde seyreden tekrarlayan ateş ve seröz dokularda enflamasyonla karakterize MEFV genindeki fonksiyon kazandırıcı mutasyonlar kaynaklı olarak meydana gelen  otoinflamatuar bir hastalıktır. Bildirilen MEFV gen varyantlarının yarıdan fazlasının klinik önemi bilinmemektedir. Makine öğrenmesi klinik önemi belirlenemeyen varyantların sınıflandırılmasında önemli faydalar sağlayabilir.

            Materyal-Method: Infevers veri tabanında yer alan MEFV missense ve sessiz 266 varyant dört kategoriye ayrıldı: olası patojenik (LP), olası benign (LB), unresolved, önemi bilinmeyen varyant. Eğitim verisi olarak LP ve LB varyantlar seçildi. Diğer varyantlar belirsiz olarak kabul edildi ve test verisi olarak tercih edildi. Revel, SIFT, MetaLR ve FATHMM skorları 7 makine öğrenmesi yöntemine tabi tutuldu. Tutulan skorlar makine öğrenmesi tahminlerine göre basamaklı bir değerlendirmeye göre değerlendirildi. Buna göre 4 ve 5 puan alanlar belirsiz geri kalanlar ise doğru sınıflandırılmış  olarak kabul edildi.

Sonuç: Regresyon Ağacı ve Rasgele ormanlar eğitim verisini % 100 doğrulukla sınıflandırdı. Yedi makine öğrenmesi metodunun da kullanıldığı basamaklı sınıflandırma metodumuz 168 varyantın 139’unu  (%83) yakınını LP ve yada LB olarak sınıflandırdı.

Tartışma: Basamaklı sınıflandırma metodu MEFV varyantlarının sınıflandırılmasında mevcut algoritmalar arasında en iyi sonucu vermektedir. MEFV varyantlarının %60’ının önemi bilinmeyen varyant olarak değerlendirildiği göz önüne alındığında mevcut değerlendirme yöntemi klinik bilgilerin eşliğinde klinisyenlere varyant yorumu için daha kesin bir yorumlama imkanı ve kolaylık sağlayabilir. Ancak, basamaklı sınıflandırma algoritmasının diğer genler üzerindeki etkinliğinin belirlenebilmesi için daha fazla sayıda çalışmaya ihtiyaç vardır.