Περίληψη: | Στην εποχή που διανύουμε, η αναγνώριση προσώπου αποτελεί μια διαδικασία η οποία χαίρει εφαρμογής σε ποικίλους κλάδους της καθημερινότητάς μας. Μπορούμε να εντοπίσουμε εφαρμογή της αναγνώρισης προσώπου σε συστήματα ασφαλείας, στην αναγνώριση εγκληματιών από το σώμα της αστυνομίας, σε προγράμματα διαχείρισης φωτογραφικών άλμπουμ για την άμεση ομαδοποίηση μέσω αυτόματου προσδιορισμού της ταυτότητας του χρήστη, σε smartphones όπου καλύπτουν τις ανάγκες ασφαλούς κλειδώματος και ξεκλειδώματος της συσκευής αλλά και ασφαλών αγορών ψηφιακών υλικών και σε πολλούς ακόμα τομείς. Λόγω της σημαντικής χρήσης της συγκεκριμένης τεχνολογίας σε ένα μεγάλο εύρος εφαρμογών, οι προσπάθειες για τη βελτιστοποίηση των συστημάτων αναγνώρισης προσώπου είναι συνεχείς και σχετικές έρευνες βρίσκονται συνεχώς σε εξέλιξη. Στα πλαίσια της παρούσας διπλωματικής εργασίας παρουσιάζουμε την διαδικασία υλοποίησης συστημάτων αναγνώρισης προσώπων με χρήση συνελικτικών δικτύων (CNNs), τα οποία αποτελούν ειδικές αρχιτεκτονικές των Deep Neural Networks (DNNs) και κυριαρχούν έναντι των υπολοίπων τεχνικών αποδίδοντας υψηλά ποσοστά ακρίβειας. Ωστόσο, επικεντρωνόμαστε αρχικά σε βασικές έννοιες της Μηχανικής Μάθησης ώστε να μπορεί η συγκεκριμένη εργασία να παρέχει το απαραίτητο θεωρητικό υπόβαθρο και να αποτελέσει έναν πλήρη οδηγό για οποιονδήποτε επιθυμεί να ‘βουτήξει’ στον κόσμο της αναγνώρισης προσώπου και της κατασκευής αντίστοιχων CNNs συστημάτων. Αναφορικά, λοιπόν, με τη διάρθρωση της συγκεκριμένης εργασίας, στο πρώτο κεφάλαιο ο αναγνώστης εισάγεται σε βασικές έννοιες και αρχές της Μηχανικής Μάθησης καθώς επίσης στον τρόπο ορθής σχεδίασης ενός αντίστοιχου συστήματος. Στο δεύτερο κεφάλαιο επικεντρωνόμαστε στα Βαθιά Νευρωνικά Δίκτυα , όπου παρουσιάζονται και αναλύονται τα συστατικά στοιχεία ενός DNN καλύπτοντας ότι πρέπει κανείς να λάβει υπόψη του για την κατασκευή ενός τέτοιου δικτύου. Στο τρίτο κεφάλαιο εμβαθύνουμε στα CNNs περιγράφοντας τα βασικά στοιχεία της αρχιτεκτονικής των συγκεκριμένων δικτύων καθώς και την εφαρμογή τους στην αναγνώριση προσώπου ενώ επιπροσθέτων παρουσιάζονται περιληπτικά κάποια από τα πιο διαδεδομένα CNN μοντέλα. Τέλος, στο τέταρτο κεφάλαιο προβαίνουμε σε υλοποίηση δύο συστημάτων αναγνώρισης προσώπου με χρήση των CNN μοντέλων FaceNet και VGG-Face ενώ στη δεύτερη περίπτωση εφαρμόζουμε transfer learning μέσω της χρήσης των βαρών του προεκπαιδευμένου μοντέλου VGG-16. Η εκτέλεση των πειραμάτων έγινε σε Python.
|