Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης

Στην παρούσα Διπλωματική Εργασία θα ασχοληθούμε με το πρόβλημα της Υπερανάλυσης (Super Resolution) εικόνων, το πλήθος τεχνικών που υπάρχουν και τις δυσκολίες που καλούμαστε να αντιμετωπίσουμε. Οι μέθοδοι βελτίωσης του οπτικού περιεχομένου εικόνων και βίντεο μας απασχολεί όλο και περισσότερο τα τελευ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Υφαντή, Κωνσταντίνα
Άλλοι συγγραφείς: Yfanti, Konstantina
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23548
Περιγραφή
Περίληψη:Στην παρούσα Διπλωματική Εργασία θα ασχοληθούμε με το πρόβλημα της Υπερανάλυσης (Super Resolution) εικόνων, το πλήθος τεχνικών που υπάρχουν και τις δυσκολίες που καλούμαστε να αντιμετωπίσουμε. Οι μέθοδοι βελτίωσης του οπτικού περιεχομένου εικόνων και βίντεο μας απασχολεί όλο και περισσότερο τα τελευταία χρόνια. Η ραγδαία εξέλιξη της τεχνολογίας, αυξάνει διαρκώς τις απαιτήσεις του κοινού για περιεχόμενο υψηλής ποιότητας. Εκτός, όμως, από εμπορικές εφαρμογές, οι μέθοδοι υπερανάλυσης αποτελούν χρήσιμο εργαλείο και σε άλλους κλάδους. Σε περιπτώσεις παρακολούθησης [1], είναι αναγκαίο το υλικό που λαμβάνουμε από τις συσκευές καταγραφής να διευκολύνει στην αναγνώριση και ταυτοποίηση προσώπων ή οχημάτων. Στις συγκεκριμένες περιπτώσεις, μάλιστα, συχνά χρειάζεται η βελτίωση του υλικού να γίνεται σε πραγματικό χρόνο και όχι με κάποια μεταγενέστερη επεξεργασία. Επίσης, σε τομείς της ιατρικής [2], όπως η ακτινολογία, χρειάζονται απεικονίσεις υψηλής ποιότητας που θα συμβάλλουν στην ακριβέστερη διάγνωση των ασθενών. Μεγάλη χρησιμότητα βρίσκει, επιπλέον, σε εφαρμογές του χώρου της αστρονομίας [3] και τηλεπισκόπησης [4], ορισμένες εκ των οποίων είναι η ταξινόμηση ουράνιων σωμάτων ή αντικειμένων και η βελτίωση ληφθέντων παρατηρήσεων. Αυτά είναι μερικά από τα παραδείγματα που αξίζει να αναφέρουμε, ωστόσο μπορούμε να καταλάβουμε πως οι απαιτήσεις δεν τελειώνουν εκεί. Ο όρος υπερανάλυση αναφέρεται σε μια οικογένεια τεχνικών, που έχει στόχο όχι μόνο να αυξήσει την ανάλυση, αλλά να βελτιώσει γενικά την ποιότητα εικόνων, σε μεγαλύτερο βαθμό από τις κλασικές τεχνικές επεξεργασίας εικόνας. Τέτοιες τεχνικές, είναι η εφαρμογή κάποιου είδους παρεμβολής σε συνδυασμό με μεθόδους που θα αυξήσουν τις υψηλές συχνότητες στην εικόνα. Αντίθετα, οι τεχνικές υπερανάλυσης φιλοδοξούν να εκτιμήσουν και να ανακατασκευάσουν την πληροφορία που χάθηκε μέσω της διαδικασίας απεικόνισης. Για τον σκοπό αυτό έχουν προταθεί δύο βασικές προσεγγίσεις: multi – frame super resolution και single image super resolution. Στην πρώτη περίπτωση, βασιζόμαστε σε ένα σύνολο παρατηρήσεων χαμηλής ανάλυσης της ίδιας σκηνής, οι οποίες δεν είναι ευθυγραμμισμένες μεταξύ τους. Συνδυάζοντας τις παρατηρήσεις σε μια εικόνα υψηλής ανάλυσης, θα προκύψει νέα πληροφορία που δεν υπήρχε σε κάθε μια από τις προηγούμενες ξεχωριστά. Η δεύτερη περίπτωση αποτελεί δυσκολότερο πρόβλημα, καθώς θέλουμε να δημιουργήσουμε νέες λεπτομέρειες έχοντας την λιγότερη δυνατή πληροφορία. Λύση σε αυτό το πρόβλημα δίνεται, συνήθως, μέσω τεχνικών μηχανικής μάθησης. Τα βασικά προβλήματα που καλείται να ξεπεράσει κάθε μέθοδος υπερανάλυσης είναι ο θόρυβος, το θόλωμα και η δειγματοληψία. Το είδος υποβάθμισης που έχουν υποστεί οι παρατηρήσεις μας, αλλάζει ανάλογα την εφαρμογή και την διαδικασία απεικόνισης. Λόγω αυτής της ευαισθησίας, καταλαβαίνουμε ότι υπάρχει πλήθως θεωρητικών αλλά και πρακτικών περιορισμών, διότι πολλές φορές η λύση του προβλήματος είναι αδύνατη ή συγκεκριμένη για τη διαδικασία για την οποία σχεδιάστηκε, χωρίς εύκολο περιθώριο γενίκευσης. Ανεξάρτητα από την προσέγγιση που ακολουθούμε, μπορούμε να χωρίσουμε τις τεχνικές, ευρέως, σε δύο κατηγορίες: τις κλασικές, τεχνικές, δηλαδή, που υπάρχουν εδώ και δεκαετίες και βασίζονται σε γνώσεις στατιστικής και κλασικής επεξεργασίας σημάτων και τις μεθόδους βαθειάς μάθησης, που αναπτύχθηκαν τα τελευταία χρόνια με την άνοδο των τεχνητών νευρωνικών δικτύων. Οι τελευταίες, μάλιστα, φαίνεται να ξεπερνούν σε απόδοση τους προκάτοχούς τους. Ως αποτέλεσμα, η πλειονότητα των σύγχρονων μεθόδων βασίζεται σε μοντέλα βαθειάς μάθησης που χρησιμοποιούν τα δεδομένα για να ανακατασκευάσουν την απαραίτητη πληροφορία. Γίνεται σαφές, λοιπόν, πως το συγκεκριμένο, αποτελεί ένα πρόβλημα με ποικίλες εφαρμογές και τρόπους εξερεύνησης και επομένως αξίζει να μελετηθεί ακόμα περισσότερο.