Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/23715 |
id |
nemertes-10889-23715 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Γενετικοί αλγόριθμοι Τεχνητά νευρωνικά δίκτυα Γενετικοί αλγόριθμοι Συνάρτηση ενεργοποίησης Genetic algorithms Artificial neural networks Genetic algorithms Transfer function |
spellingShingle |
Γενετικοί αλγόριθμοι Τεχνητά νευρωνικά δίκτυα Γενετικοί αλγόριθμοι Συνάρτηση ενεργοποίησης Genetic algorithms Artificial neural networks Genetic algorithms Transfer function Γιαννακόπουλος, Στέφανος Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
description |
Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για τη διάγνωση του καρκίνου του μαστού, αλλά τα αποτελέσματα περιορίζονται σε μεγάλο βαθμό από την κλινική εμπειρία των ακτινολόγων. Ακόμη και αν ο ακτινολόγος είναι έμπειρος, χρειάζεται βιοψία για να μπορέσει να βγάλει ασφαλές πόρισμα, η οποία είναι μια χρονοβόρα διαδικασία.
Η παρούσα διπλωματική έχει ως αντικείμενο ενδιαφέροντος τη βελτιστοποίηση ενός συστήματος ανίχνευσης καρκίνου του μαστού με Νευρωνικά Δίκτυα (ΝΔ) [23] με τη χρήση Γενετικών Αλγορίθμων. Δηλαδή, η βελτιστοποίηση των παραμέτρων του ΝΔ, έτσι ώστε να βελτιωθεί η ακρίβεια της ταξινόμησης. Ως εκ τούτου γίνεται μία ανάλυση για τον τρόπο λειτουργίας των δύο αυτών αντικειμένων. Το δίκτυο θα λαμβάνει σαν είσοδο, μετά από κατάλληλη επεξεργασία τους, μαστογραφίες οι οποίες είναι ήδη διαγνωσμένες. Στην συνέχεια, που αποτελούν το σύνολο εκπαίδευσης του ΝΔ. Το αρχικό σύνολο διαμελίζεται σε δύο υποσύνολα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, σε αναλογία 80% και 20%. Το δίκτυο εκπαιδεύεται με το πρώτο σύυνολο και αξιολογείται με το δεύτερο. Οι μαστογραφίες κατηγοριοποιούνται στις κατηγορίες Καλοήθης και Κακοήθης. Το δίκτυο αφού εκπαιδευτεί και αξιολογηθεί ως προς τη γενίκευσή του, καλείται να κατηγοριοποιήσει τις νέες μαστογραφίες που του δίνονται σαν είσοδος και έτσι προκύπτει ένα ποσοστό ακρίβειας, ανάλογα με το ποσοστό σωστής/λάθος ταξινόμησης. Η μέθοδος εκμάθησης του δικτύου είναι επιβλεπόμενη (supervised) και χρησιμοποιείται ο αλγόριθμος backpropagation.
Όσον αφορά τα Νευρωνικά Δίκτυα ορίστηκαν τέσσερις υπερ-παράμετροι οι οποίοι βελτιστοποιήθηκαν και συγκεκριμένα το dropout, learning rate, dense nodes (αριθμός νευρώνων ανά επίπεδο) και dense layers (αριθμός κρυφών επιπέδων), οι οποίοι θα αναλυθούν παρακάτω. Επίσης ως Συνάρτηση Καταλληλότητας (Fitness Function) χρησιμοποιήθηκε η F(x) = (1 )/(1 +minf(x)) όπου f(x) είναι το σφάλμα, στην έξοδο του δικτύου. Σκοπός ήταν να ελαχιστοποιηθεί το σφάλμα. Το μικρότερο σφάλμα που προκύπτει από κάθε τρέξιμο μεταφέρεται στην επόμενη γενιά. Το τελικό δίκτυο που προέκυψε έχει ποσοστό πρόβλεψης 69,56%, δηλαδή προβλέπει σε περίπου 7 από 10 μαστογραφίες σωστά την κατηγορία τους. Πιο συγκεκριμένα, προβλέπει σωστά τα περιστατικά με Καλοήθη όγκο με ποσοστό 75.00% και τα περιστατικά με Κακοήθη όγκο με 65.38%. |
author2 |
Giannakopoulos, Stefanos |
author_facet |
Giannakopoulos, Stefanos Γιαννακόπουλος, Στέφανος |
author |
Γιαννακόπουλος, Στέφανος |
author_sort |
Γιαννακόπουλος, Στέφανος |
title |
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
title_short |
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
title_full |
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
title_fullStr |
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
title_full_unstemmed |
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
title_sort |
βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές |
publishDate |
2022 |
url |
https://hdl.handle.net/10889/23715 |
work_keys_str_mv |
AT giannakopoulosstephanos beltistopoiēsēsystēmatosypostērixēsdiagnōsēskarkinoumeexeliktikestechnikes AT giannakopoulosstephanos optimizationofcancerdiagnosissupportsystemwithevolutionarytechniques |
_version_ |
1771297330839945216 |
spelling |
nemertes-10889-237152022-11-08T04:38:30Z Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές Optimization of cancer diagnosis support system with evolutionary techniques Γιαννακόπουλος, Στέφανος Giannakopoulos, Stefanos Γενετικοί αλγόριθμοι Τεχνητά νευρωνικά δίκτυα Γενετικοί αλγόριθμοι Συνάρτηση ενεργοποίησης Genetic algorithms Artificial neural networks Genetic algorithms Transfer function Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για τη διάγνωση του καρκίνου του μαστού, αλλά τα αποτελέσματα περιορίζονται σε μεγάλο βαθμό από την κλινική εμπειρία των ακτινολόγων. Ακόμη και αν ο ακτινολόγος είναι έμπειρος, χρειάζεται βιοψία για να μπορέσει να βγάλει ασφαλές πόρισμα, η οποία είναι μια χρονοβόρα διαδικασία. Η παρούσα διπλωματική έχει ως αντικείμενο ενδιαφέροντος τη βελτιστοποίηση ενός συστήματος ανίχνευσης καρκίνου του μαστού με Νευρωνικά Δίκτυα (ΝΔ) [23] με τη χρήση Γενετικών Αλγορίθμων. Δηλαδή, η βελτιστοποίηση των παραμέτρων του ΝΔ, έτσι ώστε να βελτιωθεί η ακρίβεια της ταξινόμησης. Ως εκ τούτου γίνεται μία ανάλυση για τον τρόπο λειτουργίας των δύο αυτών αντικειμένων. Το δίκτυο θα λαμβάνει σαν είσοδο, μετά από κατάλληλη επεξεργασία τους, μαστογραφίες οι οποίες είναι ήδη διαγνωσμένες. Στην συνέχεια, που αποτελούν το σύνολο εκπαίδευσης του ΝΔ. Το αρχικό σύνολο διαμελίζεται σε δύο υποσύνολα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, σε αναλογία 80% και 20%. Το δίκτυο εκπαιδεύεται με το πρώτο σύυνολο και αξιολογείται με το δεύτερο. Οι μαστογραφίες κατηγοριοποιούνται στις κατηγορίες Καλοήθης και Κακοήθης. Το δίκτυο αφού εκπαιδευτεί και αξιολογηθεί ως προς τη γενίκευσή του, καλείται να κατηγοριοποιήσει τις νέες μαστογραφίες που του δίνονται σαν είσοδος και έτσι προκύπτει ένα ποσοστό ακρίβειας, ανάλογα με το ποσοστό σωστής/λάθος ταξινόμησης. Η μέθοδος εκμάθησης του δικτύου είναι επιβλεπόμενη (supervised) και χρησιμοποιείται ο αλγόριθμος backpropagation. Όσον αφορά τα Νευρωνικά Δίκτυα ορίστηκαν τέσσερις υπερ-παράμετροι οι οποίοι βελτιστοποιήθηκαν και συγκεκριμένα το dropout, learning rate, dense nodes (αριθμός νευρώνων ανά επίπεδο) και dense layers (αριθμός κρυφών επιπέδων), οι οποίοι θα αναλυθούν παρακάτω. Επίσης ως Συνάρτηση Καταλληλότητας (Fitness Function) χρησιμοποιήθηκε η F(x) = (1 )/(1 +minf(x)) όπου f(x) είναι το σφάλμα, στην έξοδο του δικτύου. Σκοπός ήταν να ελαχιστοποιηθεί το σφάλμα. Το μικρότερο σφάλμα που προκύπτει από κάθε τρέξιμο μεταφέρεται στην επόμενη γενιά. Το τελικό δίκτυο που προέκυψε έχει ποσοστό πρόβλεψης 69,56%, δηλαδή προβλέπει σε περίπου 7 από 10 μαστογραφίες σωστά την κατηγορία τους. Πιο συγκεκριμένα, προβλέπει σωστά τα περιστατικά με Καλοήθη όγκο με ποσοστό 75.00% και τα περιστατικά με Κακοήθη όγκο με 65.38%. Breast cancer is the most common cancer in women and is a major threat to their lives and health. It is estimated that more than 1.6 million new cases of breast cancer occurred in women worldwide in 2010. Mammography is an effective method for diagnosing breast cancer, but the results are largely limited by the clinical experience of radiologists. Even if the radiologist is experienced, a biopsy is needed before he or she can reach a safe conclusion, which is a time-consuming process. This thesis is interested in optimizing a Breast Cancer Detection System with Neural Networks (NN) [23] using Genetic Algorithms. That is, the optimization of the parameters of the ND so as to improve the classification accuracy. Hence an analysis is made on how these two objects work. The network will receive as input, after their appropriate processing, mammograms which are already diagnosed. Subsequently, they form the training set of the ND. The initial set is partitioned into two subsets, the training set and the control set, in the ratio of 80% and 20%. The network is trained with the first set and evaluated with the second. The mammograms are categorized into Benign and Malignant. After the network has been trained and evaluated for its genericity, it is asked to categorise the new mammograms given as input and thus an accuracy rate is obtained, depending on the correct/incorrect classification rate. The network learning method is supervised and the backpropagation algorithm is used. As far as Neural Networks are concerned, four hyper-parameters were defined which were optimized namely dropout, learning rate, dense nodes (number of neurons per layer) and dense layers (number of hidden layers), which will be analyzed below. Also, F(x) = (1 )/(1 +minf(x)) was used as the Fitness Function, where f(x) is the error, at the output of the network. The aim was to minimize the error. The smallest error resulting from each run is carried forward to the next generation. The resulting final network has a prediction rate of 69.56%, i.e. it predicts about 7 out of 10 mammograms correctly for their category. More specifically, it correctly predicts cases with a Benign tumor at a rate of 75.00% and cases with a Malignant tumor at 65.38%. 2022-11-07T08:04:39Z 2022-11-07T08:04:39Z 2022-11-06 https://hdl.handle.net/10889/23715 el Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf |