Περίληψη: | Ο κλάδος της Μηχανικής Μάθησης έχει πραγματοποιήσει τεράστια πρόοδο και έχει αποδώσει εντυπωσιακά αποτελέσματα σε πολλά προβλήματα της σύγχρονης εποχής. Η Μηχανική Μάθηση σε συνεργασία με την Όραση Υπολογιστών έχουν φτάσει στο επίπεδο δημιουργίας ευφυών συστημάτων, τα οποία είναι ικανά να μαθαίνουν και να εκπαιδεύονται, με αποτέλεσμα να διαθέτουν τεράστια ικανότητα στο να παράγουν αξιόπιστες αποφάσεις. Για αυτό αποτελούν χρήσιμα εργαλεία και εφαρμόζονται με επιτυχία σε πολλά προβλήματα, όπως είναι η αναγνώριση εικόνας, η αναγνώριση ομιλίας. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη και η ανάλυση ενός προβλήματος Κατηγοριοποίησης εικόνων. Πιο αναλυτικά, επιλέχθηκε ένα σύνολο δεδομένων που αποτελείται από εικόνες φυλλωμάτων φασολιών, οι οποίες χωρίζονται σε τρεις κύριες κλάσεις (δύο ασθενείς και μία υγιής). Μέσω αυτής της μελέτης περιγράφονται εκτενώς οι κυριότεροι αλγόριθμοι Μηχανικής Μάθησης και παρουσιάζονται τεχνικές σημαντικές για την ορθή προεπεξεργασία των δεδομένων. Ακόμα, γίνεται παρουσίαση κλασικών μεθόδων εξαγωγής χαρακτηριστικών από εικόνες, όπως είναι το Ιστόγραμμα Προσανατολισμένων Κλίσεων (HOG), αλλά και πιο πολύπλοκων μεθόδων μέσω προ-εκπαιδευμένων Υπολειμματικών Νευρωνικών Δικτύων 50 επιπέδων (ResNet50). Επιπλέον, γίνεται αναφορά της μεθόδου της Ιεραρχικής Κατηγοριοποίησης, όπου οι προς πρόβλεψη κλάσεις, μπορούν να οργανωθούν και να αναπαρασταθούν σε μια ιεραρχία κλάσεων-σε μορφή δέντρου. Στην ουσία, η Ιεραρχική Κατηγοριοποίηση επιτρέπει την "απλοποίηση" του δοθέντος προβλήματος εικόνων τριών κλάσεων σε δύο υπο-προβλήματα δύο κλάσεων, ένα πιο γενικό, το οποίο διαχωρίζει τα ασθενή από τα υγιή φυτά, και ένα πιο ειδικό, το οποίο διαχωρίζει τα νοσούντα φυτά μεταξύ των δύο κλάσεων των ασθενειών. Όσον αφορά την Ιεραρχική Κατηγοριοποίηση, δημιουργήθηκαν δύο διαφορετικές προσεγγίσεις του προβλήματος. Η πρώτη καλείται Αυστηρή Ιεραρχική Κατηγοριοποίηση και βασίζεται στην εκπαίδευση των βέλτιστων μοντέλων για κάθε ένα από τα δύο υπο-προβλήματα ξεχωριστά. Έπειτα, δημιουργήθηκε ένας αλγόριθμος, ο οποίος αρχικά χρησιμοποιεί το μοντέλο για το γενικό πρόβλημα και προβλέπει τις δύο κλάσεις. Στη συνέχεια, το μοντέλο για το ειδικό πρόβλημα βασίζεται στις αρχικές προβλέψεις, και με βάση αυτές πραγματοποιεί το διαχωρισμό των άλλων δύο κλάσεων. Έτσι προκύπτουν οι τελικές ταξινομήσεις αυτής της προσέγγισης. Η δεύτερη ονομάζεται Επιεικής Ιεραρχική Κατηγοριοποίηση και βασίζεται στην πιθανοτική κατανομή των κλάσεων του ταξινομητή για κάθε δείγμα του συνόλου εκπαίδευσης και των τριών προβλημάτων (των δύο υπο-προβλημάτων και του βασικού προβλήματος τριών κλάσεων). Στην έκταση αυτής της διπλωματικής εργασίας παρουσιάζεται μια σειρά προσπαθειών εύρεσης του βέλτιστου μοντέλου διαχωρισμού των εικόνων στις τρεις κλάσεις. Καταλήγουμε πως το βέλτιστο μοντέλο επιτυγχάνει απόδοση 97.67% στο προ-ορισμένο σύνολο ελέγχου του συνόλου δεδομένων, και προκύπτει από την προσέγγιση της Επιεικούς Ιεραρχικής Κατηγοριοποίησης σε συνδυασμό με τα ResNet50 χαρακτηριστικά.
|