Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας

Η παρούσα διπλωματική εργασία πραγματεύεται τη δημιουργία εφαρμογής αναγνώρισης προσώπου σε γυαλιά επαυξημένης πραγματικότητας για άτομα με προβλήματα στην κεντρική όραση. Δεδομένου ότι πολλές παθήσεις, που προσβάλλουν τη κεντρική όραση των ανθρώπων, δεν έχουν ακόμη αντιμετωπιστεί μέσω κάποιας γενετ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μόσχος, Γρηγόριος
Άλλοι συγγραφείς: Moschos, Grigoris
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/24728
id nemertes-10889-24728
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Αναγνώριση προσώπων
Βαθιά μάθηση
Βοηθήματα χαμηλής όρασης
Κόστος αντίθεσης γωνιακού περιθωρίου
Face recogntion
Deep learning
Low vision aids
Angular margin contrastive loss
spellingShingle Αναγνώριση προσώπων
Βαθιά μάθηση
Βοηθήματα χαμηλής όρασης
Κόστος αντίθεσης γωνιακού περιθωρίου
Face recogntion
Deep learning
Low vision aids
Angular margin contrastive loss
Μόσχος, Γρηγόριος
Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
description Η παρούσα διπλωματική εργασία πραγματεύεται τη δημιουργία εφαρμογής αναγνώρισης προσώπου σε γυαλιά επαυξημένης πραγματικότητας για άτομα με προβλήματα στην κεντρική όραση. Δεδομένου ότι πολλές παθήσεις, που προσβάλλουν τη κεντρική όραση των ανθρώπων, δεν έχουν ακόμη αντιμετωπιστεί μέσω κάποιας γενετικής θεραπείας και από τη στιγμή ιδίως που αυτού του είδους οι παθήσεις δεν είναι διαθλαστικές αλλά εκφυλιστικές ,η αντιμετώπιση τους με ένα συμβατό γυαλί δεν επιφέρει ουσιαστικά αποτελέσματα για την επαρκή αντιμετώπιση του εν λόγω προβλήματος. Το γεγονός αυτό μας οδηγεί στην ιδέα σχεδιασμού ενός ηλεκτρονικού βοηθήματος όρασης ,το οποίο μέσω αλγορίθμων υπολογιστικής όρασης θα ενημερώνει το χρήστη για οπτικά συμβάντα ,τα οποία δεν είναι σε θέση να αντιληφθεί. Σύμφωνα με πρόσφατη δημοσίευση [16] , ένα από τα (μεγαλύτερα) προβλήματα που δημιουργεί στα άτομα η μειωμένη κεντρική όραση είναι η δυσκολία αναγνώρισης προσώπων και κατ’ επέκτασιν η αδυναμία των ατόμων αυτών να αναγνωρίζουν τα οικεία τους πρόσωπα ,γεγονός που τους προκαλεί κοινωνική πίεση και άγχος ,οδηγώντας τους σε απομονωτικές τάσεις ,πολλές φορές μάλιστα ακόμα και σε κατάθλιψη . Στόχος λοιπόν της διπλωματικής εργασίας είναι η υλοποίηση εφαρμογής αναγνώρισης προσώπων ούτως, ώστε να επιλυθεί ως ένα βαθμό το εν λόγω πρόβλημα. Για την επίτευξη του παραπάνω σκοπού επιχειρήθηκαν δύο διαφορετικές προσεγγίσεις . Η μεν πρώτη χρησιμοποιεί μοντέλο εξαγωγής χαρακτηριστικών για πρόσωπα υψηλής ανάλυσης ,ενώ πρόσωπα χαμηλής ανάλυσης επαναφέρονται με τεχνική Super Resolution και στη συνέχεια περνούν μέσα από το μοντέλο. Ωστόσο κρίνεται μη αποτελεσματική για τις συνθήκες του συγκεκριμένου προβλήματος τόσο ως προς την ακρίβεια της αναγνώρισης όσο και ως προς τη ταχύτητα απόκρισης. Αντίθετα, η δεύτερη χρησιμοποιεί μοντέλο εξαγωγής χαρακτηριστικών τόσο για υψηλής όσο και χαμηλής ανάλυσης πρόσωπα και εμφανίζει αρκετά ενθαρρυντικά αποτελέσματα, γεγονός που την καθιστά καταλληλότερη και οδήγησε στην προσπάθεια υλοποίησής της.
author2 Moschos, Grigoris
author_facet Moschos, Grigoris
Μόσχος, Γρηγόριος
author Μόσχος, Γρηγόριος
author_sort Μόσχος, Γρηγόριος
title Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
title_short Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
title_full Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
title_fullStr Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
title_full_unstemmed Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
title_sort εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας
publishDate 2023
url https://hdl.handle.net/10889/24728
work_keys_str_mv AT moschosgrēgorios epharmogēanagnōrisēsprosōpōnmesōmēgrammikōnmetaschēmatismōnplērophoriassegyaliaepauxēmenēspragmatikotētas
AT moschosgrēgorios facerecogntionappusingnonlineartransformationsinarglasses
_version_ 1771297140138573824
spelling nemertes-10889-247282023-03-10T04:35:01Z Εφαρμογή αναγνώρισης προσώπων μέσω μη γραμμικών μετασχηματισμών πληροφορίας σε γυαλιά επαυξημένης πραγματικότητας Face recogntion app using non linear transformations in AR glasses Μόσχος, Γρηγόριος Moschos, Grigoris Αναγνώριση προσώπων Βαθιά μάθηση Βοηθήματα χαμηλής όρασης Κόστος αντίθεσης γωνιακού περιθωρίου Face recogntion Deep learning Low vision aids Angular margin contrastive loss Η παρούσα διπλωματική εργασία πραγματεύεται τη δημιουργία εφαρμογής αναγνώρισης προσώπου σε γυαλιά επαυξημένης πραγματικότητας για άτομα με προβλήματα στην κεντρική όραση. Δεδομένου ότι πολλές παθήσεις, που προσβάλλουν τη κεντρική όραση των ανθρώπων, δεν έχουν ακόμη αντιμετωπιστεί μέσω κάποιας γενετικής θεραπείας και από τη στιγμή ιδίως που αυτού του είδους οι παθήσεις δεν είναι διαθλαστικές αλλά εκφυλιστικές ,η αντιμετώπιση τους με ένα συμβατό γυαλί δεν επιφέρει ουσιαστικά αποτελέσματα για την επαρκή αντιμετώπιση του εν λόγω προβλήματος. Το γεγονός αυτό μας οδηγεί στην ιδέα σχεδιασμού ενός ηλεκτρονικού βοηθήματος όρασης ,το οποίο μέσω αλγορίθμων υπολογιστικής όρασης θα ενημερώνει το χρήστη για οπτικά συμβάντα ,τα οποία δεν είναι σε θέση να αντιληφθεί. Σύμφωνα με πρόσφατη δημοσίευση [16] , ένα από τα (μεγαλύτερα) προβλήματα που δημιουργεί στα άτομα η μειωμένη κεντρική όραση είναι η δυσκολία αναγνώρισης προσώπων και κατ’ επέκτασιν η αδυναμία των ατόμων αυτών να αναγνωρίζουν τα οικεία τους πρόσωπα ,γεγονός που τους προκαλεί κοινωνική πίεση και άγχος ,οδηγώντας τους σε απομονωτικές τάσεις ,πολλές φορές μάλιστα ακόμα και σε κατάθλιψη . Στόχος λοιπόν της διπλωματικής εργασίας είναι η υλοποίηση εφαρμογής αναγνώρισης προσώπων ούτως, ώστε να επιλυθεί ως ένα βαθμό το εν λόγω πρόβλημα. Για την επίτευξη του παραπάνω σκοπού επιχειρήθηκαν δύο διαφορετικές προσεγγίσεις . Η μεν πρώτη χρησιμοποιεί μοντέλο εξαγωγής χαρακτηριστικών για πρόσωπα υψηλής ανάλυσης ,ενώ πρόσωπα χαμηλής ανάλυσης επαναφέρονται με τεχνική Super Resolution και στη συνέχεια περνούν μέσα από το μοντέλο. Ωστόσο κρίνεται μη αποτελεσματική για τις συνθήκες του συγκεκριμένου προβλήματος τόσο ως προς την ακρίβεια της αναγνώρισης όσο και ως προς τη ταχύτητα απόκρισης. Αντίθετα, η δεύτερη χρησιμοποιεί μοντέλο εξαγωγής χαρακτηριστικών τόσο για υψηλής όσο και χαμηλής ανάλυσης πρόσωπα και εμφανίζει αρκετά ενθαρρυντικά αποτελέσματα, γεγονός που την καθιστά καταλληλότερη και οδήγησε στην προσπάθεια υλοποίησής της. The current diploma thesis deals with the creation of a face recognition application in augmented reality glasses for people with central vision problems. Since many diseases that affect people's central vision have not yet been treated through some genetic therapy, and especially considering the fact that these diseases are not refractive but degenerative, treating them with compatible glasses does not bring about substantial results for the adequate treatment of the problem. This fact leads us to the idea of designing an electronic vision aid, which through computer vision algorithms will inform the user about visual events, that he is not able to perceive. According to a recent publication [16], one of the (biggest) problems created by people with reduced central vision is the difficulty of recognizing faces and, by extension, the inability of these people to recognize their familiar faces, which causes them social pressure . and anxiety, leading them to tendencies of isolation , often even to depression.To achieve the above goal, two different approaches were attempted. The first uses a feature extraction model for high-resolution faces, while low-resolution faces are restored with a Super Resolution technique and then passed as input through the model. However, it is considered ineffective for the conditions of the specific problem both in terms of recognition accuracy and response speed. On the contrary, the second one uses a feature extraction model for both high and low resolution faces and shows quite encouraging results, making it more suitable and leading to the effort of implementing it. 2023-03-09T06:28:13Z 2023-03-09T06:28:13Z 2023-03-07 https://hdl.handle.net/10889/24728 el application/pdf