Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου

Τα τελευταία χρόνια η αναγνώριση προσώπου αποτελεί ένα απαιτητικό πρόβλημα στον τομέα της επεξεργασίας εικόνας, της αναγνώρισης προτύπων και της μηχανικής όρασης, προσελκύοντας το επιστημονικό ενδιαφέρον, καθώς αποτελεί ένα πεδίο με πολλές πρακτικές εμπορικές εφαρμογές και συστήματα ασφαλείας. Δεδομ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τσιρογιάννη, Μαρία
Άλλοι συγγραφείς: Tsirogianni, Maria
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/16119
id nemertes-10889-16119
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Υπερπλήρες λεξικό
Συντελεστής αραιότητας
Διαφασματική ανακατασκευή
Βαθμός ομοιότητας ανακατασκευασμένης και αρχικής εικόνας
Βαθμός ομοιότητας αρχικών διαφασματικών εικόνων
Overcomplete dictionary
Sparsity measure
Cross-spectral reconstruction
spellingShingle Υπερπλήρες λεξικό
Συντελεστής αραιότητας
Διαφασματική ανακατασκευή
Βαθμός ομοιότητας ανακατασκευασμένης και αρχικής εικόνας
Βαθμός ομοιότητας αρχικών διαφασματικών εικόνων
Overcomplete dictionary
Sparsity measure
Cross-spectral reconstruction
Τσιρογιάννη, Μαρία
Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
description Τα τελευταία χρόνια η αναγνώριση προσώπου αποτελεί ένα απαιτητικό πρόβλημα στον τομέα της επεξεργασίας εικόνας, της αναγνώρισης προτύπων και της μηχανικής όρασης, προσελκύοντας το επιστημονικό ενδιαφέρον, καθώς αποτελεί ένα πεδίο με πολλές πρακτικές εμπορικές εφαρμογές και συστήματα ασφαλείας. Δεδομένου ότι η οπτική αναγνώριση αντιμετωπίζει πολλές δυσκολίες σε πραγματικές συνθήκες λόγω μη ομοιόμορφου φωτισμού, αλλαγής πόζας και μεταμφίεσης, τα περισσότερα συστήματα ασφαλείας χρησιμοποιούν συνδυασμό οπτικών και θερμικών εικόνων για πιο ακριβή αναγνώριση. Επίσης, πολλά συστήματα αναγνώρισης προσώπου χρησιμοποιούν κάμερες ασφαλείας που αποθανατίζουν εικόνες στο υπέρυθρο φάσμα, όμως οι βάσεις δεδομένων εικόνων που είναι προσβάσιμες στις αρχές περιέχουν εικόνες στο οπτικό φάσμα. Συνεπώς, προκύπτει πάλι η ανάγκη συσχέτισης των εικόνων μεταξύ των δύο φασμάτων. Στόχος της διπλωματικής αυτής είναι να παρουσιάσει μια προσέγγιση σε αυτό το πρόβλημα μέσω της ανακατασκευής μιας υπέρυθρης εικόνας στην αντίστοιχη οπτική της και αντίστροφα, το οποίο θα μπορεί να ενσωματωθεί μέσα σε ήδη υπάρχοντα συστήματα αναγνώρισης σαν ένα επιπλέον εργαλείο βελτιστοποίησης της απόδοσης του. Αυτή η προσέγγιση που παρουσιάζεται σε αυτή την εργασία μπορεί να εφαρμοστεί σε πραγματικά σενάρια γιατί δεν χρειάζεται να έχουμε χιλιάδες οπτικές εικόνες να προβληθούν πάνω σε έναν κοινό υπόχωρο για μετέπειτα αντιστοίχιση. Στην εργασία αυτή, θα υλοποιηθεί πειραματικά το πρώτο στοιχείο του συστήματος, αυτό της ανακατασκευής. Η υλοποίηση αυτής της πρότασης προσεγγίστηκε μέσω αραιών αναπαραστάσεων και εκμάθησης συζευγμένων υπερπλήρων λεξικών και βασίστηκε σε μια προτεινόμενη μέθοδο που μπορεί να αντιμετωπίσει με τον παραπάνω τρόπο το πρόβλημα της διαφασματικής ανακατασκευής. Τα λεξικά παρέχουν μια αραιή αναπαράσταση η οποία μπορεί να μετατρέψει τα δεδομένα σε έναν μοναδικό, λανθάνων χώρο που θα είναι ανεπηρέαστος από τους διαφορετικούς τομείς και μέσω αυτών θα εκπαιδευτεί μια αντιστοίχιση μεταξύ των δυο φασμάτων. Συγκεκριμένα, στο Κεφάλαιο 1 εισάγεται η έννοια ενός βιομετρικού συστήματος, καθώς και οι ορισμοί της αναγνώρισης, επαλήθευσης, αναγκαιότητας συνδυασμού εικόνων από διαφορετικά φάσματα για πραγματικά σενάρια και της χρησιμότητας της εκμάθησης συζευγμένων λεξικών σε πρακτικές εφαρμογές. Στο Κεφάλαιο 2 αναλύεται η ανάγκη μείωσης των διαστάσεων και γίνεται μια αναφορά και σύγκριση μεταξύ των ”παραδοσιακών” τεχνικών και των νεότερων που αφορούν τις αραιές αναπαραστάσεις. Στο Κεφάλαιο 3 γίνεται εκτενής αναφορά σε τεχνικές εκμάθησης λεξικών και σε άπληστους αλγόριθμους. Το Κεφάλαιο 4 πραγματεύεται την αρχιτεκτονική του συστήματος, την υλοποίηση και τα αποτελέσματα του πειραματικού μέρους, ενώ στο Κεφάλαιο 5 αναφέρονται σημαντικά συμπεράσματα καθώς και προτεινόμενες μελλοντικές επεκτάσεις.
author2 Tsirogianni, Maria
author_facet Tsirogianni, Maria
Τσιρογιάννη, Μαρία
author Τσιρογιάννη, Μαρία
author_sort Τσιρογιάννη, Μαρία
title Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
title_short Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
title_full Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
title_fullStr Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
title_full_unstemmed Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
title_sort διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου
publishDate 2022
url http://hdl.handle.net/10889/16119
work_keys_str_mv AT tsirogiannēmaria diaphasmatikēanakataskeuēeikonōngiaanagnōrisēprosōpou
AT tsirogiannēmaria crossspectralimagereconstructionforfacerecognition
_version_ 1799945011496747008
spelling nemertes-10889-161192022-09-06T05:13:25Z Διαφασματική ανακατασκευή εικόνων για αναγνώριση προσώπου Cross spectral image reconstruction for face recognition Τσιρογιάννη, Μαρία Tsirogianni, Maria Υπερπλήρες λεξικό Συντελεστής αραιότητας Διαφασματική ανακατασκευή Βαθμός ομοιότητας ανακατασκευασμένης και αρχικής εικόνας Βαθμός ομοιότητας αρχικών διαφασματικών εικόνων Overcomplete dictionary Sparsity measure Cross-spectral reconstruction Τα τελευταία χρόνια η αναγνώριση προσώπου αποτελεί ένα απαιτητικό πρόβλημα στον τομέα της επεξεργασίας εικόνας, της αναγνώρισης προτύπων και της μηχανικής όρασης, προσελκύοντας το επιστημονικό ενδιαφέρον, καθώς αποτελεί ένα πεδίο με πολλές πρακτικές εμπορικές εφαρμογές και συστήματα ασφαλείας. Δεδομένου ότι η οπτική αναγνώριση αντιμετωπίζει πολλές δυσκολίες σε πραγματικές συνθήκες λόγω μη ομοιόμορφου φωτισμού, αλλαγής πόζας και μεταμφίεσης, τα περισσότερα συστήματα ασφαλείας χρησιμοποιούν συνδυασμό οπτικών και θερμικών εικόνων για πιο ακριβή αναγνώριση. Επίσης, πολλά συστήματα αναγνώρισης προσώπου χρησιμοποιούν κάμερες ασφαλείας που αποθανατίζουν εικόνες στο υπέρυθρο φάσμα, όμως οι βάσεις δεδομένων εικόνων που είναι προσβάσιμες στις αρχές περιέχουν εικόνες στο οπτικό φάσμα. Συνεπώς, προκύπτει πάλι η ανάγκη συσχέτισης των εικόνων μεταξύ των δύο φασμάτων. Στόχος της διπλωματικής αυτής είναι να παρουσιάσει μια προσέγγιση σε αυτό το πρόβλημα μέσω της ανακατασκευής μιας υπέρυθρης εικόνας στην αντίστοιχη οπτική της και αντίστροφα, το οποίο θα μπορεί να ενσωματωθεί μέσα σε ήδη υπάρχοντα συστήματα αναγνώρισης σαν ένα επιπλέον εργαλείο βελτιστοποίησης της απόδοσης του. Αυτή η προσέγγιση που παρουσιάζεται σε αυτή την εργασία μπορεί να εφαρμοστεί σε πραγματικά σενάρια γιατί δεν χρειάζεται να έχουμε χιλιάδες οπτικές εικόνες να προβληθούν πάνω σε έναν κοινό υπόχωρο για μετέπειτα αντιστοίχιση. Στην εργασία αυτή, θα υλοποιηθεί πειραματικά το πρώτο στοιχείο του συστήματος, αυτό της ανακατασκευής. Η υλοποίηση αυτής της πρότασης προσεγγίστηκε μέσω αραιών αναπαραστάσεων και εκμάθησης συζευγμένων υπερπλήρων λεξικών και βασίστηκε σε μια προτεινόμενη μέθοδο που μπορεί να αντιμετωπίσει με τον παραπάνω τρόπο το πρόβλημα της διαφασματικής ανακατασκευής. Τα λεξικά παρέχουν μια αραιή αναπαράσταση η οποία μπορεί να μετατρέψει τα δεδομένα σε έναν μοναδικό, λανθάνων χώρο που θα είναι ανεπηρέαστος από τους διαφορετικούς τομείς και μέσω αυτών θα εκπαιδευτεί μια αντιστοίχιση μεταξύ των δυο φασμάτων. Συγκεκριμένα, στο Κεφάλαιο 1 εισάγεται η έννοια ενός βιομετρικού συστήματος, καθώς και οι ορισμοί της αναγνώρισης, επαλήθευσης, αναγκαιότητας συνδυασμού εικόνων από διαφορετικά φάσματα για πραγματικά σενάρια και της χρησιμότητας της εκμάθησης συζευγμένων λεξικών σε πρακτικές εφαρμογές. Στο Κεφάλαιο 2 αναλύεται η ανάγκη μείωσης των διαστάσεων και γίνεται μια αναφορά και σύγκριση μεταξύ των ”παραδοσιακών” τεχνικών και των νεότερων που αφορούν τις αραιές αναπαραστάσεις. Στο Κεφάλαιο 3 γίνεται εκτενής αναφορά σε τεχνικές εκμάθησης λεξικών και σε άπληστους αλγόριθμους. Το Κεφάλαιο 4 πραγματεύεται την αρχιτεκτονική του συστήματος, την υλοποίηση και τα αποτελέσματα του πειραματικού μέρους, ενώ στο Κεφάλαιο 5 αναφέρονται σημαντικά συμπεράσματα καθώς και προτεινόμενες μελλοντικές επεκτάσεις. In recent years, face recognition has been a demanding problem in the field of image processing, pattern recognition and mechanical vision, attracting scientific interest as it is a field with many practical commercial applications and security systems. Because visual recognition faces many difficulties in real-world conditions due to uneven lighting, pose change, and disguise, most optical and thermal imaging device security systems provide more accurate identification. Also, many face recognition systems use security cameras that capture images in the infrared spectrum, but the image databases that are accessible to the authorities contain images in the optical spectrum. The aim of this thesis is to present an approach to this problem by reconstructing an infrared image in its respective perspective and vice versa, which can be integrated into existing recognition systems as an additional tool to optimize its performance. This approach presented in this work can be applied to real-world scenarios because we do not need to have thousands of visual images projected onto a common subspace for later mapping. The implementation of this proposal was approached through sparse representations and learning of coupled dictionaries and it was based on a proposed method that can address in the above way the problem of Heterogeneous Face reconstruction. Dictionaries provide a sparse representation that can turn data into a unique, latent space that will be unaffected by different domains and will train a correspondence between the two spectra. In particular, Chapter 1 introduces the concept of a biometric system, as well as the definitions of recognition, verification, the necessity of combining images from different spectra for real-world scenarios, and the usefulness of learning conjugate dictionaries in practical applications. In Chapter 2 discusses the need for dimensionality reduction and provides a discussion and comparison between ”traditional” techniques and newer ones involving sparse representations. In Chapter 3, extensive reference is made to dictionary learning techniques and greedy algorithms. Chapter 4 discusses the system architecture, implementation and results of the experimental part, while Chapter 5 reports important conclusions as well as proposed future extensions. 2022-03-18T11:53:42Z 2022-03-18T11:53:42Z 2022-03-17 http://hdl.handle.net/10889/16119 gr application/pdf