Περίληψη: | Η αραιή αναπαράσταση έχει προσελκύσει μεγάλη προσοχή από ερευνητές στα πεδία της επεξεργασίας σήματος, επεξεργασία εικόνας, την υπολογιστική όραση και την αναγνώριση προτύπων. Έχει αποκτήσει παράλληλα καλή φήμη τόσο στη θεωρητική έρευνα όσο και σε πρακτικές εφαρμογές.
Στην παρούσα διπλωματική αρχικά αναλύονται θεμελιώδεις και πρωταρχικές έννοιες γύρω από την αραιή αναπαράσταση και θέτονται η μαθηματική βάση και φορμαλισμός των υπό επίλυση προβλημάτων. Το γενικό πλαίσιο της αραιής εκπροσώπησης είναι η εκμετάλλευση του γραμμικού συνδυασμού ορισμένων δειγμάτων προς την αντιπροσώπευση του υπό εκπροσώπηση δείγματος. H αραιή εκπροσώπηση ωστόσο, εξαρτάται σε μεγάλο βαθμό από την εκάστοτε νόρμα που επιβάλλεται στην αναπαράσταση. Έτσι συνοψίζεται και ομαδοποιείται σε διαφορετικές κατηγορίες όσον αφορά τις νόρμες κανονικοποίησης που χρησιμοποιούνται. Θεωρείται λοιπόν σκόπιμη η παρουσίαση, και η ανάλυση των 5 κυρίαρχων norms. Επίσης γίνεται μια μικρή αναφορά σε homotopy αλγορίθμους. Η μέθοδος homotopy προτάθηκε αρχικά για την επίλυση του least square προβλήματος με επιβολή ποινής l_1. Μέσω αυτών πετύχαμε την επίλυση του προβλήματος ελαχιστοποίησης της l_1 νόρμας.
Αφού έχουμε θέσει τα πλαίσια των προβλημάτων που θα αντιμετωπίσουμε, περνάμε στο κομμάτι της βάσης και των περιγραφέων. Τα σχήματα που χρησιμοποιούμε κατά την ανάλυσή μας ανήκουν στη βάση shrec11 και είναι εύκαμπτα (non-rigid). Με βάση αυτά εξάγουμε χαρακτηριστικά με φασματικές μεθόδους που βασίζονται σε γράφους καθώς παρουσιάζουν πολλές χρήσιμες ιδιότητες, οι οποίες και παρουσιάζονται. Οι φασματικές μέθοδοι βασίζονται στον Laplace–Beltrami τελεστή και οι περιγραφείς που χρησιμοποιούμε είναι ο Shape-DNA ο GPS, τα χαρακτηριστικά των οποίων αναλύονται.
Στη συνέχεια εφαρμόζουμε την μέθοδο sparse representation classification (SRC). Εξετάζεται η συγκέντρωση των αραιών συντελεστών καθώς και η απόδοση αυτού με την l_1 νόρμα και με την l_2 νορμα. Επίσης μελετάται και ο ρόλος της εξαγωγής χαρακτηριστικών στην απόδοση του. Για λίγα δείγματα εκπαίδευσης προτείνεται ο Extended Sparse Representation Based Classifier (ESRC), ο οποίος είναι αποτελεσματικός ακόμα και όταν υπάρχει ένα μόνο δείγμα εκπαίδευσης ανά κλάση. Γίνεται παρουσίαση του αλγορίθμου και επιβεβαιώνεται πειραματικά η ανωτερότητα του έναντι του SRC. Παράλληλα εξετάζεται αν το κλειδί στην απόδοση του SRC είναι η αραιότητα των συντελεστών ή η συνεργατική αναπαράσταση των δειγμάτων. Μετά από την ανάλυση του ρόλου και της συμβολής του καθενός εξ αυτών καταλήγουμε στον αλγόριθμο Collaborative Sparse Representation (CRC). Ο CRC βασίζεται περισσότερο στην συνεργατική αναπαράσταση των δειγμάτων και χαλαρώνει την απαίτηση αραιότητας των συντελεστών.
Τέλος παρουσιάζουμε τα αποτελέσματα των αλγορίθμων και διεξάγουμε πειράματα με τον αριθμό των ιδιοτιμών του περιγραφέα καθώς και τον αριθμό των δειγμάτων εκπαίδευσης.
|