Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές

Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γιαννακόπουλος, Στέφανος
Άλλοι συγγραφείς: Giannakopoulos, Stefanos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23715
id nemertes-10889-23715
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Γενετικοί αλγόριθμοι
Τεχνητά νευρωνικά δίκτυα
Γενετικοί αλγόριθμοι
Συνάρτηση ενεργοποίησης
Genetic algorithms
Artificial neural networks
Genetic algorithms
Transfer function
spellingShingle Γενετικοί αλγόριθμοι
Τεχνητά νευρωνικά δίκτυα
Γενετικοί αλγόριθμοι
Συνάρτηση ενεργοποίησης
Genetic algorithms
Artificial neural networks
Genetic algorithms
Transfer function
Γιαννακόπουλος, Στέφανος
Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
description Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για τη διάγνωση του καρκίνου του μαστού, αλλά τα αποτελέσματα περιορίζονται σε μεγάλο βαθμό από την κλινική εμπειρία των ακτινολόγων. Ακόμη και αν ο ακτινολόγος είναι έμπειρος, χρειάζεται βιοψία για να μπορέσει να βγάλει ασφαλές πόρισμα, η οποία είναι μια χρονοβόρα διαδικασία. Η παρούσα διπλωματική έχει ως αντικείμενο ενδιαφέροντος τη βελτιστοποίηση ενός συστήματος ανίχνευσης καρκίνου του μαστού με Νευρωνικά Δίκτυα (ΝΔ) [23] με τη χρήση Γενετικών Αλγορίθμων. Δηλαδή, η βελτιστοποίηση των παραμέτρων του ΝΔ, έτσι ώστε να βελτιωθεί η ακρίβεια της ταξινόμησης. Ως εκ τούτου γίνεται μία ανάλυση για τον τρόπο λειτουργίας των δύο αυτών αντικειμένων. Το δίκτυο θα λαμβάνει σαν είσοδο, μετά από κατάλληλη επεξεργασία τους, μαστογραφίες οι οποίες είναι ήδη διαγνωσμένες. Στην συνέχεια, που αποτελούν το σύνολο εκπαίδευσης του ΝΔ. Το αρχικό σύνολο διαμελίζεται σε δύο υποσύνολα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, σε αναλογία 80% και 20%. Το δίκτυο εκπαιδεύεται με το πρώτο σύυνολο και αξιολογείται με το δεύτερο. Οι μαστογραφίες κατηγοριοποιούνται στις κατηγορίες Καλοήθης και Κακοήθης. Το δίκτυο αφού εκπαιδευτεί και αξιολογηθεί ως προς τη γενίκευσή του, καλείται να κατηγοριοποιήσει τις νέες μαστογραφίες που του δίνονται σαν είσοδος και έτσι προκύπτει ένα ποσοστό ακρίβειας, ανάλογα με το ποσοστό σωστής/λάθος ταξινόμησης. Η μέθοδος εκμάθησης του δικτύου είναι επιβλεπόμενη (supervised) και χρησιμοποιείται ο αλγόριθμος backpropagation. Όσον αφορά τα Νευρωνικά Δίκτυα ορίστηκαν τέσσερις υπερ-παράμετροι οι οποίοι βελτιστοποιήθηκαν και συγκεκριμένα το dropout, learning rate, dense nodes (αριθμός νευρώνων ανά επίπεδο) και dense layers (αριθμός κρυφών επιπέδων), οι οποίοι θα αναλυθούν παρακάτω. Επίσης ως Συνάρτηση Καταλληλότητας (Fitness Function) χρησιμοποιήθηκε η F(x) = (1 )/(1 +minf(x)) όπου f(x) είναι το σφάλμα, στην έξοδο του δικτύου. Σκοπός ήταν να ελαχιστοποιηθεί το σφάλμα. Το μικρότερο σφάλμα που προκύπτει από κάθε τρέξιμο μεταφέρεται στην επόμενη γενιά. Το τελικό δίκτυο που προέκυψε έχει ποσοστό πρόβλεψης 69,56%, δηλαδή προβλέπει σε περίπου 7 από 10 μαστογραφίες σωστά την κατηγορία τους. Πιο συγκεκριμένα, προβλέπει σωστά τα περιστατικά με Καλοήθη όγκο με ποσοστό 75.00% και τα περιστατικά με Κακοήθη όγκο με 65.38%.
author2 Giannakopoulos, Stefanos
author_facet Giannakopoulos, Stefanos
Γιαννακόπουλος, Στέφανος
author Γιαννακόπουλος, Στέφανος
author_sort Γιαννακόπουλος, Στέφανος
title Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
title_short Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
title_full Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
title_fullStr Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
title_full_unstemmed Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
title_sort βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές
publishDate 2022
url https://hdl.handle.net/10889/23715
work_keys_str_mv AT giannakopoulosstephanos beltistopoiēsēsystēmatosypostērixēsdiagnōsēskarkinoumeexeliktikestechnikes
AT giannakopoulosstephanos optimizationofcancerdiagnosissupportsystemwithevolutionarytechniques
_version_ 1771297330839945216
spelling nemertes-10889-237152022-11-08T04:38:30Z Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές Optimization of cancer diagnosis support system with evolutionary techniques Γιαννακόπουλος, Στέφανος Giannakopoulos, Stefanos Γενετικοί αλγόριθμοι Τεχνητά νευρωνικά δίκτυα Γενετικοί αλγόριθμοι Συνάρτηση ενεργοποίησης Genetic algorithms Artificial neural networks Genetic algorithms Transfer function Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για τη διάγνωση του καρκίνου του μαστού, αλλά τα αποτελέσματα περιορίζονται σε μεγάλο βαθμό από την κλινική εμπειρία των ακτινολόγων. Ακόμη και αν ο ακτινολόγος είναι έμπειρος, χρειάζεται βιοψία για να μπορέσει να βγάλει ασφαλές πόρισμα, η οποία είναι μια χρονοβόρα διαδικασία. Η παρούσα διπλωματική έχει ως αντικείμενο ενδιαφέροντος τη βελτιστοποίηση ενός συστήματος ανίχνευσης καρκίνου του μαστού με Νευρωνικά Δίκτυα (ΝΔ) [23] με τη χρήση Γενετικών Αλγορίθμων. Δηλαδή, η βελτιστοποίηση των παραμέτρων του ΝΔ, έτσι ώστε να βελτιωθεί η ακρίβεια της ταξινόμησης. Ως εκ τούτου γίνεται μία ανάλυση για τον τρόπο λειτουργίας των δύο αυτών αντικειμένων. Το δίκτυο θα λαμβάνει σαν είσοδο, μετά από κατάλληλη επεξεργασία τους, μαστογραφίες οι οποίες είναι ήδη διαγνωσμένες. Στην συνέχεια, που αποτελούν το σύνολο εκπαίδευσης του ΝΔ. Το αρχικό σύνολο διαμελίζεται σε δύο υποσύνολα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, σε αναλογία 80% και 20%. Το δίκτυο εκπαιδεύεται με το πρώτο σύυνολο και αξιολογείται με το δεύτερο. Οι μαστογραφίες κατηγοριοποιούνται στις κατηγορίες Καλοήθης και Κακοήθης. Το δίκτυο αφού εκπαιδευτεί και αξιολογηθεί ως προς τη γενίκευσή του, καλείται να κατηγοριοποιήσει τις νέες μαστογραφίες που του δίνονται σαν είσοδος και έτσι προκύπτει ένα ποσοστό ακρίβειας, ανάλογα με το ποσοστό σωστής/λάθος ταξινόμησης. Η μέθοδος εκμάθησης του δικτύου είναι επιβλεπόμενη (supervised) και χρησιμοποιείται ο αλγόριθμος backpropagation. Όσον αφορά τα Νευρωνικά Δίκτυα ορίστηκαν τέσσερις υπερ-παράμετροι οι οποίοι βελτιστοποιήθηκαν και συγκεκριμένα το dropout, learning rate, dense nodes (αριθμός νευρώνων ανά επίπεδο) και dense layers (αριθμός κρυφών επιπέδων), οι οποίοι θα αναλυθούν παρακάτω. Επίσης ως Συνάρτηση Καταλληλότητας (Fitness Function) χρησιμοποιήθηκε η F(x) = (1 )/(1 +minf(x)) όπου f(x) είναι το σφάλμα, στην έξοδο του δικτύου. Σκοπός ήταν να ελαχιστοποιηθεί το σφάλμα. Το μικρότερο σφάλμα που προκύπτει από κάθε τρέξιμο μεταφέρεται στην επόμενη γενιά. Το τελικό δίκτυο που προέκυψε έχει ποσοστό πρόβλεψης 69,56%, δηλαδή προβλέπει σε περίπου 7 από 10 μαστογραφίες σωστά την κατηγορία τους. Πιο συγκεκριμένα, προβλέπει σωστά τα περιστατικά με Καλοήθη όγκο με ποσοστό 75.00% και τα περιστατικά με Κακοήθη όγκο με 65.38%. Breast cancer is the most common cancer in women and is a major threat to their lives and health. It is estimated that more than 1.6 million new cases of breast cancer occurred in women worldwide in 2010. Mammography is an effective method for diagnosing breast cancer, but the results are largely limited by the clinical experience of radiologists. Even if the radiologist is experienced, a biopsy is needed before he or she can reach a safe conclusion, which is a time-consuming process. This thesis is interested in optimizing a Breast Cancer Detection System with Neural Networks (NN) [23] using Genetic Algorithms. That is, the optimization of the parameters of the ND so as to improve the classification accuracy. Hence an analysis is made on how these two objects work. The network will receive as input, after their appropriate processing, mammograms which are already diagnosed. Subsequently, they form the training set of the ND. The initial set is partitioned into two subsets, the training set and the control set, in the ratio of 80% and 20%. The network is trained with the first set and evaluated with the second. The mammograms are categorized into Benign and Malignant. After the network has been trained and evaluated for its genericity, it is asked to categorise the new mammograms given as input and thus an accuracy rate is obtained, depending on the correct/incorrect classification rate. The network learning method is supervised and the backpropagation algorithm is used. As far as Neural Networks are concerned, four hyper-parameters were defined which were optimized namely dropout, learning rate, dense nodes (number of neurons per layer) and dense layers (number of hidden layers), which will be analyzed below. Also, F(x) = (1 )/(1 +minf(x)) was used as the Fitness Function, where f(x) is the error, at the output of the network. The aim was to minimize the error. The smallest error resulting from each run is carried forward to the next generation. The resulting final network has a prediction rate of 69.56%, i.e. it predicts about 7 out of 10 mammograms correctly for their category. More specifically, it correctly predicts cases with a Benign tumor at a rate of 75.00% and cases with a Malignant tumor at 65.38%. 2022-11-07T08:04:39Z 2022-11-07T08:04:39Z 2022-11-06 https://hdl.handle.net/10889/23715 el Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf