Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης
Ο κλάδος της Μηχανικής Μάθησης έχει πραγματοποιήσει τεράστια πρόοδο και έχει αποδώσει εντυπωσιακά αποτελέσματα σε πολλά προβλήματα της σύγχρονης εποχής. Η Μηχανική Μάθηση σε συνεργασία με την Όραση Υπολογιστών έχουν φτάσει στο επίπεδο δημιουργίας ευφυών συστημάτων, τα οποία είναι ικανά να μαθαίνουν...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15489 |
id |
nemertes-10889-15489 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Μέθοδοι κατηγοριοποίησης Κατηγοριοποίηση εικόνων Ιεραρχική κατηγοριοποίηση Όραση υπολογιστών Βαθιά μάθηση Machine learning Classification methods Image classification Hierarchical classification Computer vision Deep learning |
spellingShingle |
Μηχανική μάθηση Μέθοδοι κατηγοριοποίησης Κατηγοριοποίηση εικόνων Ιεραρχική κατηγοριοποίηση Όραση υπολογιστών Βαθιά μάθηση Machine learning Classification methods Image classification Hierarchical classification Computer vision Deep learning Σταμάτη, Κωνσταντίνα-Μαρία Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
description |
Ο κλάδος της Μηχανικής Μάθησης έχει πραγματοποιήσει τεράστια πρόοδο και έχει αποδώσει εντυπωσιακά αποτελέσματα σε πολλά προβλήματα της σύγχρονης εποχής. Η Μηχανική Μάθηση σε συνεργασία με την Όραση Υπολογιστών έχουν φτάσει στο επίπεδο δημιουργίας ευφυών συστημάτων, τα οποία είναι ικανά να μαθαίνουν και να εκπαιδεύονται, με αποτέλεσμα να διαθέτουν τεράστια ικανότητα στο να παράγουν αξιόπιστες αποφάσεις. Για αυτό αποτελούν χρήσιμα εργαλεία και εφαρμόζονται με επιτυχία σε πολλά προβλήματα, όπως είναι η αναγνώριση εικόνας, η αναγνώριση ομιλίας. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη και η ανάλυση ενός προβλήματος Κατηγοριοποίησης εικόνων. Πιο αναλυτικά, επιλέχθηκε ένα σύνολο δεδομένων που αποτελείται από εικόνες φυλλωμάτων φασολιών, οι οποίες χωρίζονται σε τρεις κύριες κλάσεις (δύο ασθενείς και μία υγιής). Μέσω αυτής της μελέτης περιγράφονται εκτενώς οι κυριότεροι αλγόριθμοι Μηχανικής Μάθησης και παρουσιάζονται τεχνικές σημαντικές για την ορθή προεπεξεργασία των δεδομένων. Ακόμα, γίνεται παρουσίαση κλασικών μεθόδων εξαγωγής χαρακτηριστικών από εικόνες, όπως είναι το Ιστόγραμμα Προσανατολισμένων Κλίσεων (HOG), αλλά και πιο πολύπλοκων μεθόδων μέσω προ-εκπαιδευμένων Υπολειμματικών Νευρωνικών Δικτύων 50 επιπέδων (ResNet50). Επιπλέον, γίνεται αναφορά της μεθόδου της Ιεραρχικής Κατηγοριοποίησης, όπου οι προς πρόβλεψη κλάσεις, μπορούν να οργανωθούν και να αναπαρασταθούν σε μια ιεραρχία κλάσεων-σε μορφή δέντρου. Στην ουσία, η Ιεραρχική Κατηγοριοποίηση επιτρέπει την "απλοποίηση" του δοθέντος προβλήματος εικόνων τριών κλάσεων σε δύο υπο-προβλήματα δύο κλάσεων, ένα πιο γενικό, το οποίο διαχωρίζει τα ασθενή από τα υγιή φυτά, και ένα πιο ειδικό, το οποίο διαχωρίζει τα νοσούντα φυτά μεταξύ των δύο κλάσεων των ασθενειών. Όσον αφορά την Ιεραρχική Κατηγοριοποίηση, δημιουργήθηκαν δύο διαφορετικές προσεγγίσεις του προβλήματος. Η πρώτη καλείται Αυστηρή Ιεραρχική Κατηγοριοποίηση και βασίζεται στην εκπαίδευση των βέλτιστων μοντέλων για κάθε ένα από τα δύο υπο-προβλήματα ξεχωριστά. Έπειτα, δημιουργήθηκε ένας αλγόριθμος, ο οποίος αρχικά χρησιμοποιεί το μοντέλο για το γενικό πρόβλημα και προβλέπει τις δύο κλάσεις. Στη συνέχεια, το μοντέλο για το ειδικό πρόβλημα βασίζεται στις αρχικές προβλέψεις, και με βάση αυτές πραγματοποιεί το διαχωρισμό των άλλων δύο κλάσεων. Έτσι προκύπτουν οι τελικές ταξινομήσεις αυτής της προσέγγισης. Η δεύτερη ονομάζεται Επιεικής Ιεραρχική Κατηγοριοποίηση και βασίζεται στην πιθανοτική κατανομή των κλάσεων του ταξινομητή για κάθε δείγμα του συνόλου εκπαίδευσης και των τριών προβλημάτων (των δύο υπο-προβλημάτων και του βασικού προβλήματος τριών κλάσεων). Στην έκταση αυτής της διπλωματικής εργασίας παρουσιάζεται μια σειρά προσπαθειών εύρεσης του βέλτιστου μοντέλου διαχωρισμού των εικόνων στις τρεις κλάσεις. Καταλήγουμε πως το βέλτιστο μοντέλο επιτυγχάνει απόδοση 97.67% στο προ-ορισμένο σύνολο ελέγχου του συνόλου δεδομένων, και προκύπτει από την προσέγγιση της Επιεικούς Ιεραρχικής Κατηγοριοποίησης σε συνδυασμό με τα ResNet50 χαρακτηριστικά. |
author2 |
Stamati, Konstantina-Maria |
author_facet |
Stamati, Konstantina-Maria Σταμάτη, Κωνσταντίνα-Μαρία |
author |
Σταμάτη, Κωνσταντίνα-Μαρία |
author_sort |
Σταμάτη, Κωνσταντίνα-Μαρία |
title |
Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
title_short |
Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
title_full |
Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
title_fullStr |
Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
title_full_unstemmed |
Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
title_sort |
αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/15489 |
work_keys_str_mv |
AT stamatēkōnstantinamaria algorithmoikatēgoriopoiēsēsmiameletēperiptōsēs AT stamatēkōnstantinamaria classificationalgorithmsacasestudy |
_version_ |
1771297337857015808 |
spelling |
nemertes-10889-154892022-09-05T20:15:41Z Αλγόριθμοι κατηγοριοποίησης : μια μελέτη περίπτωσης Classification algorithms : a case study Σταμάτη, Κωνσταντίνα-Μαρία Stamati, Konstantina-Maria Μηχανική μάθηση Μέθοδοι κατηγοριοποίησης Κατηγοριοποίηση εικόνων Ιεραρχική κατηγοριοποίηση Όραση υπολογιστών Βαθιά μάθηση Machine learning Classification methods Image classification Hierarchical classification Computer vision Deep learning Ο κλάδος της Μηχανικής Μάθησης έχει πραγματοποιήσει τεράστια πρόοδο και έχει αποδώσει εντυπωσιακά αποτελέσματα σε πολλά προβλήματα της σύγχρονης εποχής. Η Μηχανική Μάθηση σε συνεργασία με την Όραση Υπολογιστών έχουν φτάσει στο επίπεδο δημιουργίας ευφυών συστημάτων, τα οποία είναι ικανά να μαθαίνουν και να εκπαιδεύονται, με αποτέλεσμα να διαθέτουν τεράστια ικανότητα στο να παράγουν αξιόπιστες αποφάσεις. Για αυτό αποτελούν χρήσιμα εργαλεία και εφαρμόζονται με επιτυχία σε πολλά προβλήματα, όπως είναι η αναγνώριση εικόνας, η αναγνώριση ομιλίας. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη και η ανάλυση ενός προβλήματος Κατηγοριοποίησης εικόνων. Πιο αναλυτικά, επιλέχθηκε ένα σύνολο δεδομένων που αποτελείται από εικόνες φυλλωμάτων φασολιών, οι οποίες χωρίζονται σε τρεις κύριες κλάσεις (δύο ασθενείς και μία υγιής). Μέσω αυτής της μελέτης περιγράφονται εκτενώς οι κυριότεροι αλγόριθμοι Μηχανικής Μάθησης και παρουσιάζονται τεχνικές σημαντικές για την ορθή προεπεξεργασία των δεδομένων. Ακόμα, γίνεται παρουσίαση κλασικών μεθόδων εξαγωγής χαρακτηριστικών από εικόνες, όπως είναι το Ιστόγραμμα Προσανατολισμένων Κλίσεων (HOG), αλλά και πιο πολύπλοκων μεθόδων μέσω προ-εκπαιδευμένων Υπολειμματικών Νευρωνικών Δικτύων 50 επιπέδων (ResNet50). Επιπλέον, γίνεται αναφορά της μεθόδου της Ιεραρχικής Κατηγοριοποίησης, όπου οι προς πρόβλεψη κλάσεις, μπορούν να οργανωθούν και να αναπαρασταθούν σε μια ιεραρχία κλάσεων-σε μορφή δέντρου. Στην ουσία, η Ιεραρχική Κατηγοριοποίηση επιτρέπει την "απλοποίηση" του δοθέντος προβλήματος εικόνων τριών κλάσεων σε δύο υπο-προβλήματα δύο κλάσεων, ένα πιο γενικό, το οποίο διαχωρίζει τα ασθενή από τα υγιή φυτά, και ένα πιο ειδικό, το οποίο διαχωρίζει τα νοσούντα φυτά μεταξύ των δύο κλάσεων των ασθενειών. Όσον αφορά την Ιεραρχική Κατηγοριοποίηση, δημιουργήθηκαν δύο διαφορετικές προσεγγίσεις του προβλήματος. Η πρώτη καλείται Αυστηρή Ιεραρχική Κατηγοριοποίηση και βασίζεται στην εκπαίδευση των βέλτιστων μοντέλων για κάθε ένα από τα δύο υπο-προβλήματα ξεχωριστά. Έπειτα, δημιουργήθηκε ένας αλγόριθμος, ο οποίος αρχικά χρησιμοποιεί το μοντέλο για το γενικό πρόβλημα και προβλέπει τις δύο κλάσεις. Στη συνέχεια, το μοντέλο για το ειδικό πρόβλημα βασίζεται στις αρχικές προβλέψεις, και με βάση αυτές πραγματοποιεί το διαχωρισμό των άλλων δύο κλάσεων. Έτσι προκύπτουν οι τελικές ταξινομήσεις αυτής της προσέγγισης. Η δεύτερη ονομάζεται Επιεικής Ιεραρχική Κατηγοριοποίηση και βασίζεται στην πιθανοτική κατανομή των κλάσεων του ταξινομητή για κάθε δείγμα του συνόλου εκπαίδευσης και των τριών προβλημάτων (των δύο υπο-προβλημάτων και του βασικού προβλήματος τριών κλάσεων). Στην έκταση αυτής της διπλωματικής εργασίας παρουσιάζεται μια σειρά προσπαθειών εύρεσης του βέλτιστου μοντέλου διαχωρισμού των εικόνων στις τρεις κλάσεις. Καταλήγουμε πως το βέλτιστο μοντέλο επιτυγχάνει απόδοση 97.67% στο προ-ορισμένο σύνολο ελέγχου του συνόλου δεδομένων, και προκύπτει από την προσέγγιση της Επιεικούς Ιεραρχικής Κατηγοριοποίησης σε συνδυασμό με τα ResNet50 χαρακτηριστικά. The field of Machine Learning has made tremendous progress and has yielded impressive results in many problems of modern times. Machine Learning in collaboration with Computer Vision have reached the level of creating intelligent systems, which are capable of learning and training, resulting in a huge ability of making reliable decisions. This is why they are useful tools and are successfully applied to many problems, such as image recognition, speech recognition. The object of the present thesis is the study and the analysis of an Image Classification task. In more detail, we selected a data set consisting of bean leaf images, which are divided into three main classes (two diseased and one healthy). Through this study, the main Machine Learning algorithms are extensively described, and techniques, important for the correct data pre-processing, are presented. Furthermore, there is a presentation of some classic methods for extracting features from images, such as Histogram of Oriented Gradients (HOG), but also more complex methods through pre-trained Residual Neural Networks of 50 layers (ResNet50). In addition, there is a reference to the method of Hierarchical Classification, in which the predicted classes can be organized and represented in an hierarchy of classes, usually in the form of a tree. In essence, the Hierarchical Classification "simplifies" the given problem of three classes into two sub-problems of two classes; a more general one, which separates the diseased from the healthy plants, and a more specific one, which separates the diseased plants between the two classes of the diseases. Regarding the Hierarchical Classification, we created two different approaches of the problem. The first is called Hard Hierarchical Classification, and is based on the training of the optimal models for each of the two sub-problems separately. An algorithm was then created, which initially uses the model for the general problem and predicts the two classes. Next, the model for the specific problem is based on the initial predictions, and based on these, it separates the other two classes. This is how the final predictions of this approach developed. The second is called Soft Hierarchical Classification and is based on the probabilistic distribution of each class of the classifier for each instance of the training set of all three problems (the two sub-problems and the basic problem of three classes). In the scope of this thesis, a series of attempts are made in order to built the optimal model for the separation of images into the three classes. We conclude that the optimal model achieves a yield of 97.67% in the predefined test set of the data set, and results from the Soft Hierarchical Classification approach combined with the ResNet50 Features. 2021-11-02T07:39:03Z 2021-11-02T07:39:03Z 2021-09-23 http://hdl.handle.net/10889/15489 gr application/pdf |