Βελτιστοποίηση συστήματος υποστήριξης διάγνωσης καρκίνου με εξελικτικές τεχνικές

Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γιαννακόπουλος, Στέφανος
Άλλοι συγγραφείς: Giannakopoulos, Stefanos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23715
Περιγραφή
Περίληψη:Ο καρκίνος του μαστού είναι ο συχνότερος καρκίνος στις γυναίκες και αποτελεί μεγάλη απειλή για τη ζωή και την υγεία τους. Εκτιμάται ότι περισσότερα από 1,6 εκατομμύρια νέα περιστατικά καρκίνου του μαστού εμφανίστηκαν σε γυναίκες παγκοσμίως το 2010. Η μαστογραφία είναι μια αποτελεσματική μέθοδος για τη διάγνωση του καρκίνου του μαστού, αλλά τα αποτελέσματα περιορίζονται σε μεγάλο βαθμό από την κλινική εμπειρία των ακτινολόγων. Ακόμη και αν ο ακτινολόγος είναι έμπειρος, χρειάζεται βιοψία για να μπορέσει να βγάλει ασφαλές πόρισμα, η οποία είναι μια χρονοβόρα διαδικασία. Η παρούσα διπλωματική έχει ως αντικείμενο ενδιαφέροντος τη βελτιστοποίηση ενός συστήματος ανίχνευσης καρκίνου του μαστού με Νευρωνικά Δίκτυα (ΝΔ) [23] με τη χρήση Γενετικών Αλγορίθμων. Δηλαδή, η βελτιστοποίηση των παραμέτρων του ΝΔ, έτσι ώστε να βελτιωθεί η ακρίβεια της ταξινόμησης. Ως εκ τούτου γίνεται μία ανάλυση για τον τρόπο λειτουργίας των δύο αυτών αντικειμένων. Το δίκτυο θα λαμβάνει σαν είσοδο, μετά από κατάλληλη επεξεργασία τους, μαστογραφίες οι οποίες είναι ήδη διαγνωσμένες. Στην συνέχεια, που αποτελούν το σύνολο εκπαίδευσης του ΝΔ. Το αρχικό σύνολο διαμελίζεται σε δύο υποσύνολα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, σε αναλογία 80% και 20%. Το δίκτυο εκπαιδεύεται με το πρώτο σύυνολο και αξιολογείται με το δεύτερο. Οι μαστογραφίες κατηγοριοποιούνται στις κατηγορίες Καλοήθης και Κακοήθης. Το δίκτυο αφού εκπαιδευτεί και αξιολογηθεί ως προς τη γενίκευσή του, καλείται να κατηγοριοποιήσει τις νέες μαστογραφίες που του δίνονται σαν είσοδος και έτσι προκύπτει ένα ποσοστό ακρίβειας, ανάλογα με το ποσοστό σωστής/λάθος ταξινόμησης. Η μέθοδος εκμάθησης του δικτύου είναι επιβλεπόμενη (supervised) και χρησιμοποιείται ο αλγόριθμος backpropagation. Όσον αφορά τα Νευρωνικά Δίκτυα ορίστηκαν τέσσερις υπερ-παράμετροι οι οποίοι βελτιστοποιήθηκαν και συγκεκριμένα το dropout, learning rate, dense nodes (αριθμός νευρώνων ανά επίπεδο) και dense layers (αριθμός κρυφών επιπέδων), οι οποίοι θα αναλυθούν παρακάτω. Επίσης ως Συνάρτηση Καταλληλότητας (Fitness Function) χρησιμοποιήθηκε η F(x) = (1 )/(1 +minf(x)) όπου f(x) είναι το σφάλμα, στην έξοδο του δικτύου. Σκοπός ήταν να ελαχιστοποιηθεί το σφάλμα. Το μικρότερο σφάλμα που προκύπτει από κάθε τρέξιμο μεταφέρεται στην επόμενη γενιά. Το τελικό δίκτυο που προέκυψε έχει ποσοστό πρόβλεψης 69,56%, δηλαδή προβλέπει σε περίπου 7 από 10 μαστογραφίες σωστά την κατηγορία τους. Πιο συγκεκριμένα, προβλέπει σωστά τα περιστατικά με Καλοήθη όγκο με ποσοστό 75.00% και τα περιστατικά με Κακοήθη όγκο με 65.38%.