Περίληψη: | Τα δεδομένα εικόνας και πολυμέσων χαρακτηρίζονται ενδογενώς από υψηλή διαστατικότητα. Ταυτόχρονα όμως, οι εφαρμογές που αξιοποιούν τέτοιου είδους δεδομένα βασίζονται στην εκτίμηση ενός πολύ μικρότερου αριθμού μακροσκοπικών παραμέτρων που καθορίζουν το περιεχόμενο των δεδομένων και συνιστούν τη σημασιολογική πληροφορία που αυτά φέρουν. Από γεωμετρικής σκοπιάς η παρατήρηση αυτή σημαίνει πως τα δεδομένα που εξετάζονται από ένα δεδομένο πρόβλημα ανάλυσης και αναγνώρισης προτύπων και χαρακτηρίζονται από το ίδιο σύνολο μακροσκοπικών παραμέτρων, κείνται επάνω σε πολυδιάστατες και μη-γραμμικές γεωμετρικές δομές εντός του χώρου των πρωτόγεννων δεδομένων, που ονομάζονται πολλαπλότητες. Κατά την τελευταία δεκαετία στο πεδίο της αναγνώρισης προτύπων συντελείται μία συστηματική προσπάθεια για την ανάπτυξη αποτελεσματικών μεθόδων που έχουν σαν στόχο την εκμάθησης τέτοιων δομών πολλαπλότητας σε δεδομένα εικόνας και πολυμέσων. Ταυτόχρονα, οι τελευταίες εξελίξεις σε άλλους κλάδους της πληροφορικής έχουν προσφέρει νέα εργαλεία και προσεγγίσεις στο πρόβλημα της εκμάθησης δομών πολλαπλότητας, και γενικότερα στη διαχείριση των μη-γραμμικών συσχετίσεων ανάμεσα στα πρωτογενή δεδομένα και το σημασιολογικό περιεχόμενο αυτών, για την αποτελεσματικότερη επίλυση προβλημάτων αναγνώρισης προτύπων.
Αντικείμενο της παρούσης διατριβής είναι η αξιοποίηση σύγχρονων μεθόδων εκμάθησης πολλαπλότητας, καθώς και εργαλείων από άλλα επιστημονικά πεδία όπως η θεωρεία γράφων και οι πλεονάζουσες αναπαραστάσεις, σε εφαρμογές αναγνώρισης προτύπων και ανάλυσης εικόνων και πολυμεσικών δεδομένων. Η αξιοποίηση της ενδογενούς γεωμετρικής δομής των δεδομένων μελετάται τόσο σε επίπεδο τοπικής πολλαπλότητας, όπου εξετάζεται η γεωμετρική δομή τοπικών χαρακτηριστικών των σημάτων, όσο και σε επίπεδο καθολικής πολλαπλότητας όπου γίνεται η θεώρηση της γενικής πολλαπλότητας στην οποία ανήκει το σύνολο των σημάτων με συγκεκριμένα χαρακτηριστικά. Οι εφαρμογές που μελετώνται εκτείνονται από τη βιομετρία (αναγνώριση προσώπου, υπογραφής και δραστηριότητας) έως την ιατρική πληροφορική όπου αναπτύσσονται μέθοδοι ταξινόμησης εικόνων φθορίζουσας μικροσκοπίας. Για κάθε εφαρμογή προτείνονται ολοκληρωμένα συστήματα που αξιοποιούν κατάλληλα την πληροφορία των δομών πολλαπλότητας, ενώ ταυτόχρονα αναπτύσσονται νέοι περιγραφείς και τεχνικές αναπαράστασης των πρωτογενών δεομένων όπου αυτό κρίνεται απαραίτητο. Τέλος προτείνονται πρωτότυπα μέτρα απόστασης ανάμεσα σε δομές τοπικής πολλαπλότητας, για την αξιοποίηση σε εφαρμογές ανάλυσης και αναγνώρισης προτύπων.
|