Περίληψη: | Η ανίχνευση της υπνηλίας με τη χρήση αλγορίθμων μηχανικής μάθησης αποτελεί το κύριο ζήτημα της παρούσας διπλωματικής εργασίας. Σε αυτή την εργασία, αναπτύξαμε πολλαπλούς αλγόριθμους ανίχνευσης της υπνηλίας εστιάζοντας κυρίως στις εκφράσεις του προσώπου. Αποφασίστηκε να αντιμετωπιστεί το ζήτημα αυτό ως ένα ζήτημα ταξινόμησης μεταξύ δύο διαφορετικών κλάσεων.
Στην αρχή, επικεντρωθήκαμε στην ανάπτυξη αλγορίθμων μηχανικής μάθησης που δέχονται αριθμητικά δεδομένα ως είσοδο. Αυτά τα αριθμητικά δεδομένα προέκυψαν από τον υπολογισμό πολύτιμων μετρικών του προσώπου με την βοήθεια εξωτερικών βιβλιοθηκών όπως η Dlib και η OpenCV. Οι αλγόριθμοι k-πλησιέστερων γειτόνων, τυχαίου δάσους και δέντρου απόφασης έδειξαν υψηλές ακρίβειες κοντά στο 83%, επιλύοντας πολύ καλά το ζήτημα της ανίχνευσης υπνηλίας.
Τα συνελικτικά νευρωνικά δίκτυα χρησιμοποιούνται στη δεύτερη κατηγορία αλγορίθμων για την ανίχνευση της υπνηλίας. Τα δεδομένα μας σε αυτή την κατηγορία είναι φωτογραφίες προσώπων και τα ίδια τα νευρωνικά δίκτυα εξάγουν τα χρήσιμα χαρακτηριστικά για την κατηγοριοποίηση. Εκπαιδεύσαμε τέσσερα διαφορετικά μοντέλα: δύο που χρησιμοποιούν τη μεταφορά γνώσης (transfer learning) με τα προ-εκπαιδευμένα δίκτυα «VGG-16» και «Xception» και άλλα δυο που βασίζονται σε προηγούμενη έρευνα στο ίδιο σύνολο δεδομένων. Με σχετικά χαμηλή ακρίβεια στα δεδομένα επικύρωσης, όλα τα μοντέλα φαίνεται να υπερπροσαρμόζονται στο σύνολο εκπαίδευσης. Με ακρίβεια 68% στα δεδομένα επικύρωσης, το μοντέλο Xception παρήγαγε τα καλύτερα αποτελέσματα από όλα τα μοντέλα.
Μετά την εκπαίδευση και της δεύτερης κατηγορίας αλγορίθμων είμαστε σε θέση να βγάλουμε το συμπέρασμα ότι τα συνελικτικά νευρωνικά δίκτυα που χρησιμοποιήθηκαν αδυνατούν να αντιμετωπίσουν το ζήτημα της ανίχνευσης της υπνηλίας πιο αποτελεσματικά από τις πιο απλές τεχνικές μηχανικής μάθησης, παρά την αυξημένη πολυπλοκότητά τους και το υψηλότερο υπολογιστικό κόστος για την εκπαίδευση.
|