dc.contributor.author | AY, ŞEVKET | |
dc.date.accessioned | 2024-03-05T11:06:29Z | |
dc.date.available | 2024-03-05T11:06:29Z | |
dc.date.issued | 2023 | en_US |
dc.date.submitted | 2023-07-20 | |
dc.identifier.other | 817013 | |
dc.identifier.uri | https://hdl.handle.net/20.500.14002/2423 | |
dc.description.abstract | BEYİN MR GÖRÜNTÜLERİNDE GİZLİLİK TABANLI
YAKLAŞIM : FEDERE ÖĞRENME
ÖZET
Güçlü derin öğrenme modelleri, çok fazla veriye ve veri çeşitliliğine ihtiyaç
duymaktadır. Tıp alanı modellerin kullanımı açısından en popüler olan alanlardan bir
tanesidir. Tıp alanında çok fazla veri vardır ancak gizlilik nedeniyle tıbbi verilere
erişim oldukça sınırlıdır. Bu durum sağlık sektöründeki AI çözümlerinin gelişimini
yavaşlatmakta ve olumsuz anlamda etkilemektedir. Gizlilik sorununu ele alan bir
yaklaşım federe öğrenmedir. Federe öğrenme, kurumların verilerini dışarıya
çıkarmadan diğer kurumlar ile işbirlikçi model gelişimini sağlayarak veri gizliliğini
korumaktadır böylece derin öğrenme modellerinin geliştirilmesine katkıda
bulunabilmektedir. Bu çalışmada, Federe öğrenme ile tıp alanındaki mahremiyet
sorununa odaklanılmıştır. Beyin tümörü görüntülerini sınıflandırmak amacıyla
görüntü sınıflandırma problemlerinde en çok tercih edilen derin öğrenme ağı olan
Evrişimli Sinir Ağı'na (CNN) dayalı bir model federe öğrenme ile entegre edilmiştir.
Yerel CNN modelleri, simule edilen üç farklı kuruluşun yerel cihazlarının Manyetik
Rezonans Görüntüleri (MRI) kullanılarak başlatılmıştır. Sunucuda bulunan global
CNN modeli yerel CNN modellerinin ağırlıkları ile beslenmektedir. Yerel model
ağırlıkları sunucuda optimize edilen yerel model ağırlığı ile güncellenmiştir. Federe
Ortalama (FedAvg), FedAvg ile kuantum Federe ortalama (QFedAvg), Hata
Toleranslı FedAvg ve diferansiyel gizlilik ile birlikte FedAvg olmak üzere dört farklı
Federe öğrenme stratejisi kullanılmıştır. FedAvg olarak adlandırılan ilk stratejide üç
farklı istemciden gelen model ağırlıkları sunucuda model ağırlıklarının ortalaması
alınarak optimize edilmektedir. İkinci strateji olan QFedAvg yönteminde ise standart
FedAvg yöntemine bir q parametresi eklenmektedir. Bu parametre ile istemciler arası
olabilecek farklılıklar toplanan model ağırlıklarının optimize edilmesinde dikkate
alınmaktadır. Üçüncü strateji ise Hata Toleranslı FedAvg stratejisidir. Hata toleranslı
yaklaşım eğitim sürecinde herhangi bir sebepten dolayı bir istemcide oluşabilecek
hata veya kopmaların tolere edilmesini içermektedir. Son stratejide ise sunucuda
standart FedAvg model ağırlıklarını optimize ederken kullanılmıştır fakat ilk
yöntemden farklı olarak sunucuya model ağırlığı gönderilmeden önce bir istemcinin
model ağırlıklarına diferansiyel gizlilik ile gürültü eklenmiştir. Dördüncü stratejinin
amacı her ne kadar sadece model ağırlıklarının iletilmesi olsa da olası herhangi bir
saldırıda model ağırlıklarının elde edilmesini engellemektir. Her bir strateji 10 turda
eğitilmiş ve en başarılı stratejinin FedAvg olduğu görülmüştür. FedAvg’e göre son
turda eğitilen modelin ilk turda eğitilen modele göre %41 daha başarılı olduğu
kanıtlanmıştır. Önerilen tüm stratejiler kullanılarak yerel verilerin istemcilerde
kalması sağlanarak istemciler arası ortak bir model geliştirilmiştir. Gizliliğin
korunmadığı ve verilerin bir sunucuda toplanarak eğitim yapıldığı klasik derin
öğrenme modellerine kıyasla hem gizlilik korunmuş hem de istemcilerin daha az
yerel veri ile yüksek model başarımı elde etmesi sağlanmıştır. | en_US |
dc.description.abstract | PRIVACY-BASED APPROACH TO BRAIN MRI: FEDERATED
LEARNING
ABSTRACT
Powerful deep learning models need a lot of data and data diversity. The medical
field is one of the most popular fields in terms of the use of models. There is a lot of
data in the medical field, but access to medical data is very limited due to
confidentiality. This slows down and negatively affects the development of AI
solutions in the healthcare industry. One approach to addressing the privacy issue is
federated learning. Federated learning protects data confidentiality by providing
collaborative model development with other institutions without exposing the data of
institutions, so it can contribute to the development of deep learning models. This
study focuses on the problem of privacy in the medical field with Federated learning.
In order to classify brain tumor images, a model based on Convolutional Neural
Network (CNN), which is the most preferred deep learning network in image
classification problems, is integrated with federated learning. Local CNN models
were initiated using Magnetic Resonance Imaging (MRI) of local devices from three
different organizations simulated. The global CNN model on the server is fed with
the weights of the local CNN models. The local model weights have been updated
with the local model weight optimized on the server. Four different Federated
learning strategies were used: Federated Average (FedAvg), FedAvg with quantum
Federated average (QFedAvg), FedAvg with Fault Tolerance, and FedAvg with
differential privacy. In the first strategy, called FedAvg, the model weights from
three different clients are optimized by averaging the model weights on the server. In
the second strategy, the QFedAvg method, a q parameter is added to the standard
FedAvg method. With this parameter, differences between clients are taken into
account in optimizing the collected model weights. The third strategy is the Fault
Tolerant FedAvg strategy. This approach includes tolerating errors or breaks that
may occur in a client for any reason during the training process. In the last strategy,
the standard FedAvg model weights are used on the server, but unlike the first
method, differential privacy and noise are added to the model weights of a client
before the model weight is sent to the server. The goal of the fourth strategy is to
prevent model weights from being acquired in any possible attack, although only the
model weights are transmitted. Each strategy was trained for 10 rounds and it was
seen that the most successful strategy was FedAvg. According to FedAvg, the model
trained in the last round proved to be 41% more successful than the model trained in
the first round. A common client-to-client model has been developed by keeping the
local data on the clients by using all the suggested strategies. Compared to classical
deep learning models, where confidentiality is not protected and data is collected and
trained on a server, both confidentiality is preserved and clients are provided with
high model performance with less local data. | en_US |
dc.description.tableofcontents | İÇİNDEKİLER
BEYAN........................................................................................................................ ii
TEŞEKKÜR ................................................................................................................ i
İÇİNDEKİLER .......................................................................................................... ii
KISALTMALAR ...................................................................................................... iv
SİMGELER ............................................................................................................... vi
TABLOLAR LİSTESİ............................................................................................viii
ŞEKİLLER LİSTESİ................................................................................................ ix
ÖZET........................................................................................................................... x
ABSTRACT............................................................................................................... xi
BÖLÜM 1.
GİRİŞ .......................................................................................................................... 1
BÖLÜM 2.
DERİN ÖĞRENME................................................................................................... 7
2.1. Derin Öğrenme .................................................................................................. 7
2.1.1. Evrişimli sinir ağları (CNN) .................................................................... 11
BÖLÜM 3.
FEDERE ÖĞRENME ............................................................................................. 19
3.1. Şifreleme Yöntemleri ...................................................................................... 21
3.1.1. Homomorfik şifreleme............................................................................. 21
3.1.2. Diferansiyel gizlilik.................................................................................. 23
3.2. Haberleşme Mimarileri.................................................................................... 25
3.2.1. Merkezi haberleşme mimarisi.................................................................. 26
3.2.2. Merkezi olmayan haberleşme mimarisi ................................................... 27
3.2.3. Hibrit haberleşme mimarisi...................................................................... 29
3.3. İletişim Protokolü............................................................................................ 30
3.4. Federe Öğrenme Türleri.................................................................................. 31
iii
3.4.1. Yatay Federe öğrenme ............................................................................. 31
3.4.2. Dikey federe öğrenme.............................................................................. 33
3.4.3. Bölünmüş öğrenme .................................................................................. 35
3.5. Optimizasyon Algoritmaları............................................................................ 36
3.5.1. Federe ortalama alma ............................................................................... 36
3.5.2. QFedAvg.................................................................................................. 38
3.5.3. Hata toleranslı Federe ortalama ............................................................... 40
3.6. Veri Bölümleme .............................................................................................. 42
3.7. Sıkıştırma Metotları......................................................................................... 45
3.8. Federe Öğrenme Avantajları ........................................................................... 46
3.9. Federe Öğrenme Zorlukları............................................................................. 49
3.10. Federe Öğrenme Frameworkleri ................................................................... 53
3.10.1. Flower .................................................................................................... 53
BÖLÜM 4.
DENEYSEL ÇALIŞMA .......................................................................................... 55
4.1. Veri Kümesi .................................................................................................... 55
4.2. İstemciler Arası Veri Paylaşımı ...................................................................... 57
4.3. Evrişimli Sinir Ağı’nın Oluşturulması ve Uygulanması ................................. 58
4.4. Eğitim.............................................................................................................. 63
4.5. Deneysel Sonuçlar........................................................................................... 68
4.5.1. FedAvg strajesine göre istemci ve sunucu modelleri gelişimi................. 71
4.5.2. QFedAvg strajesine göre istemci ve sunucu modelleri gelişimi.............. 76
4.5.3. Hata Toleranslı FedAvg strajesine göre istemci ve sunucu modelleri
gelişimi ...................................................................................................... 80
4.5.4. Diferansiyel Gizlilik ile birlikte FedAvg strajesine göre istemci ve sunucu
modelleri gelişimi...................................................................................... 84
4.5.5. Federe öğrenme stratejileri ile geleneksel modellerin karşılaştırılması... 89
BÖLÜM 5.
SONUÇLAR VE ÖNERİLER ................................................................................ 91
KAYNAKLAR ......................................................................................................... 94 | en_US |
dc.language.iso | tur | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Anahtar Kelimeler: Derin Öğrenme, Federe Öğrenme, Gizlilik, Sınıflandırma | en_US |
dc.subject | Keywords: Classification, Deep Learning, Federated Learning, Privacy | en_US |
dc.title | Beyin MR görüntülerinde gizlilik tabanlı yaklaşım : Federe öğrenme | en_US |
dc.title.alternative | Privacy-based approach to brain MRI: Federated learning | en_US |
dc.type | masterThesis | en_US |
dc.department | Enstitüler, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı | en_US |
dc.institutionauthor | AY, ŞEVKET | |
dc.relation.publicationcategory | Tez | en_US |