Περίληψη: | Η παρούσα διπλωματική εργασία, αναφέρεται στην κατηγοριοποίηση Ιστοπαθολογικών Εικόνων με τη χρήση διαφόρων μοντέλων Συνελικτικών Νευρωνικών Δικτύων. Σκοπός της εργασίας αποτέλεσε η μελέτη της χρήσης των νευρωνικών δικτύων και ιδιαίτερα των τεχνικών βαθιάς μάθησης, στην αυτόματη κατηγοριοποίηση (ταξινόμηση) ιατρικών εικόνων. Οι διαδικασίες ταξινόμησης που δοκιμάστηκαν βασίζονται σε τεχνικές βαθιών νευρωνικών δικτύων (DNN) και συγκεκριμένα των Συνελικτικών Νευρωνικών Δικτύων (ΣΝΔ). Σήμερα, τα δίκτυα αυτά εντάσσονται στο state-of-the-art των τεχνικών αναγνώρισης προτύπων και ιδιαίτερα στις τεχνικές που αφορούν ταξινόμηση ιατρικών δεδομένων (εικόνων).
Τα ΣΝΔ υπάρχουν σε διάφορες αρχιτεκτονικές, με διαφορετικό βάθος, διαφορετικό πλήθος συνελίξεων, διαφορετικές συναρτήσεις ενεργοποίησης και πολλές άλλες παραμέτρους και τεχνολογίες. Στην παρούσα εργασία εξετάσαμε αρχιτεκτονικές που παρουσιάζουν ξεχωριστή συμπεριφορά στην ταξινόμηση ιατρικών δεδομένων. Από αυτές επιλέξαμε οκτώ τις οποίες δοκιμάσαμε κατά την πειραματική διαδικασία: (Vgg16, Vgg19, ResNet50, ResNet101, ResNet152, MobileNet, MobileNetV2, DenseNet121).
Για την εκπαίδευση και τον έλεγχο των συστημάτων, ως ιατρικά δεδομένα, χρησιμοποιήθηκαν ιστοπαθολογικές εικόνες καρκίνου του μαστού οι οποίες ταξινομήθηκαν (διαχωρίστηκαν) σε θετικές (κακοήθη) και αρνητικές (καλοήθη), ως προς την ύπαρξη όγκου. Συγκεκριμένα, χρησιμοποιήθηκε η Ιστοπαθολογική Βάση Δεδομένων, καρκίνου του μαστού (BreaKHis) που περιέχει συνολικά 7.909 εικόνες, που συλλέχθηκαν από 82 ασθενείς: 58 με καρκίνο (5.429 κακοήθη δείγματα) και 24 με καλοήθη νεοπλασία (2.480 καλοήθη). Η ανάλυση των εικόνων είναι των 700x460 εικονοστοιχείων, RGB 3 καναλιών, βάθους 8-bit (κάθε κανάλι). Οι εικόνες στην βάση, είναι χωρισμένες (περίπου ισομερώς) ανάλογα με την μεγέθυνση του μικροσκοπίου σε τέσσερις κατηγορίες: 40x, 100x, 200x και 400x. Να σημειωθεί ότι όλα τα ΣΝΔ που χρησιμοποιήσαμε ήταν αρχικά εκπαιδευμένα (προεκπαίδευση) στον τεράστιο όγκο των δεδομένων της ImageNet.
Τα οκτώ αυτά δίκτυα, εκπαιδεύτηκαν και ελέγχθηκαν σε τρεις πειραματικές διαδικασίες: μια χωρίς προεπεξεργασία, μία με προεπεξεργασία ZCA, και μια με προεπεξεργασία PCA. Τέλος, όλα τα πειράματα επαναλήφθηκαν τέσσερις φορές, που αντιστοιχούν στις διαφορετικές κατηγορίες δεδομένων εστίασης (40x, 100x, 200x, 400x). Έτσι, το σύνολο των πειραμάτων που διεξήχθησαν ήταν 96 πειράματα, και τα αποτελέσματα αναρτώνται σε 31 συγκεντρωτικούς πίνακες και 8 διπλά σχήματα.
Τα οκτώ δίκτυα που ελέγξαμε συγκρίθηκαν μεταξύ τους και αβίαστα καταλήξαμε στο συμπέρασμα ότι δίκτυο DenseNet121 έχει την καλύτερη απόδοση. Ήταν κάτι αναμενόμενο, αφού αυτό αποτελεί εξέλιξη των δικτύων ResNet. Ενδιαφέρον ακόμα είχε το γεγονός ότι εικόνες με χαμηλή εστίαση έδωσαν καλύτερα αποτελέσματα από αυτές με υψηλή εστίαση.
Στα πειράματα, όπου στα δεδομένα είχε προηγηθεί προεπεξεργασία με την τεχνική ZCA και την PCA τα αποτελέσματα δεν θα μπορούσαμε να τα χαρακτηρίσουμε αναμενόμενα. Η προεπεξεργασία με βάση την τεχνική ZCA έδωσε ελαφρώς καλύτερα αποτελέσματα από αυτήν της PCA. Συγκρίνοντας όμως τις δύο αυτές προσεγγίσεις με την χωρίς προεπεξεργασία προσέγγιση, διαπιστώσαμε σαφή υπεροχή της χωρίς προεπεξεργασία. Η εξήγηση που μπορούμε να δώσουμε για τα αποτελέσματα αυτά είναι ότι ο περιορισμένος όγκος των δεδομένων εκπαίδευσης και ελέγχου δεν επέτρεψε να αναδειχθεί η σημαντική συνεισφορά του σταδίου της προεπεξεργασίας.
|