Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης

Στην παρούσα Διπλωματική Εργασία θα ασχοληθούμε με το πρόβλημα της Υπερανάλυσης (Super Resolution) εικόνων, το πλήθος τεχνικών που υπάρχουν και τις δυσκολίες που καλούμαστε να αντιμετωπίσουμε. Οι μέθοδοι βελτίωσης του οπτικού περιεχομένου εικόνων και βίντεο μας απασχολεί όλο και περισσότερο τα τελευ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Υφαντή, Κωνσταντίνα
Άλλοι συγγραφείς: Yfanti, Konstantina
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23548
id nemertes-10889-23548
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Υπολογιστική όραση
Υπερανάλυση εικόνων
Μηχανική μάθηση
Θεωρία εκτίμησης
Νευρωνικά δίκτυα
Computer vision
Super-resolution
Machine learning
Estimation theory
Neural networks
spellingShingle Υπολογιστική όραση
Υπερανάλυση εικόνων
Μηχανική μάθηση
Θεωρία εκτίμησης
Νευρωνικά δίκτυα
Computer vision
Super-resolution
Machine learning
Estimation theory
Neural networks
Υφαντή, Κωνσταντίνα
Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
description Στην παρούσα Διπλωματική Εργασία θα ασχοληθούμε με το πρόβλημα της Υπερανάλυσης (Super Resolution) εικόνων, το πλήθος τεχνικών που υπάρχουν και τις δυσκολίες που καλούμαστε να αντιμετωπίσουμε. Οι μέθοδοι βελτίωσης του οπτικού περιεχομένου εικόνων και βίντεο μας απασχολεί όλο και περισσότερο τα τελευταία χρόνια. Η ραγδαία εξέλιξη της τεχνολογίας, αυξάνει διαρκώς τις απαιτήσεις του κοινού για περιεχόμενο υψηλής ποιότητας. Εκτός, όμως, από εμπορικές εφαρμογές, οι μέθοδοι υπερανάλυσης αποτελούν χρήσιμο εργαλείο και σε άλλους κλάδους. Σε περιπτώσεις παρακολούθησης [1], είναι αναγκαίο το υλικό που λαμβάνουμε από τις συσκευές καταγραφής να διευκολύνει στην αναγνώριση και ταυτοποίηση προσώπων ή οχημάτων. Στις συγκεκριμένες περιπτώσεις, μάλιστα, συχνά χρειάζεται η βελτίωση του υλικού να γίνεται σε πραγματικό χρόνο και όχι με κάποια μεταγενέστερη επεξεργασία. Επίσης, σε τομείς της ιατρικής [2], όπως η ακτινολογία, χρειάζονται απεικονίσεις υψηλής ποιότητας που θα συμβάλλουν στην ακριβέστερη διάγνωση των ασθενών. Μεγάλη χρησιμότητα βρίσκει, επιπλέον, σε εφαρμογές του χώρου της αστρονομίας [3] και τηλεπισκόπησης [4], ορισμένες εκ των οποίων είναι η ταξινόμηση ουράνιων σωμάτων ή αντικειμένων και η βελτίωση ληφθέντων παρατηρήσεων. Αυτά είναι μερικά από τα παραδείγματα που αξίζει να αναφέρουμε, ωστόσο μπορούμε να καταλάβουμε πως οι απαιτήσεις δεν τελειώνουν εκεί. Ο όρος υπερανάλυση αναφέρεται σε μια οικογένεια τεχνικών, που έχει στόχο όχι μόνο να αυξήσει την ανάλυση, αλλά να βελτιώσει γενικά την ποιότητα εικόνων, σε μεγαλύτερο βαθμό από τις κλασικές τεχνικές επεξεργασίας εικόνας. Τέτοιες τεχνικές, είναι η εφαρμογή κάποιου είδους παρεμβολής σε συνδυασμό με μεθόδους που θα αυξήσουν τις υψηλές συχνότητες στην εικόνα. Αντίθετα, οι τεχνικές υπερανάλυσης φιλοδοξούν να εκτιμήσουν και να ανακατασκευάσουν την πληροφορία που χάθηκε μέσω της διαδικασίας απεικόνισης. Για τον σκοπό αυτό έχουν προταθεί δύο βασικές προσεγγίσεις: multi – frame super resolution και single image super resolution. Στην πρώτη περίπτωση, βασιζόμαστε σε ένα σύνολο παρατηρήσεων χαμηλής ανάλυσης της ίδιας σκηνής, οι οποίες δεν είναι ευθυγραμμισμένες μεταξύ τους. Συνδυάζοντας τις παρατηρήσεις σε μια εικόνα υψηλής ανάλυσης, θα προκύψει νέα πληροφορία που δεν υπήρχε σε κάθε μια από τις προηγούμενες ξεχωριστά. Η δεύτερη περίπτωση αποτελεί δυσκολότερο πρόβλημα, καθώς θέλουμε να δημιουργήσουμε νέες λεπτομέρειες έχοντας την λιγότερη δυνατή πληροφορία. Λύση σε αυτό το πρόβλημα δίνεται, συνήθως, μέσω τεχνικών μηχανικής μάθησης. Τα βασικά προβλήματα που καλείται να ξεπεράσει κάθε μέθοδος υπερανάλυσης είναι ο θόρυβος, το θόλωμα και η δειγματοληψία. Το είδος υποβάθμισης που έχουν υποστεί οι παρατηρήσεις μας, αλλάζει ανάλογα την εφαρμογή και την διαδικασία απεικόνισης. Λόγω αυτής της ευαισθησίας, καταλαβαίνουμε ότι υπάρχει πλήθως θεωρητικών αλλά και πρακτικών περιορισμών, διότι πολλές φορές η λύση του προβλήματος είναι αδύνατη ή συγκεκριμένη για τη διαδικασία για την οποία σχεδιάστηκε, χωρίς εύκολο περιθώριο γενίκευσης. Ανεξάρτητα από την προσέγγιση που ακολουθούμε, μπορούμε να χωρίσουμε τις τεχνικές, ευρέως, σε δύο κατηγορίες: τις κλασικές, τεχνικές, δηλαδή, που υπάρχουν εδώ και δεκαετίες και βασίζονται σε γνώσεις στατιστικής και κλασικής επεξεργασίας σημάτων και τις μεθόδους βαθειάς μάθησης, που αναπτύχθηκαν τα τελευταία χρόνια με την άνοδο των τεχνητών νευρωνικών δικτύων. Οι τελευταίες, μάλιστα, φαίνεται να ξεπερνούν σε απόδοση τους προκάτοχούς τους. Ως αποτέλεσμα, η πλειονότητα των σύγχρονων μεθόδων βασίζεται σε μοντέλα βαθειάς μάθησης που χρησιμοποιούν τα δεδομένα για να ανακατασκευάσουν την απαραίτητη πληροφορία. Γίνεται σαφές, λοιπόν, πως το συγκεκριμένο, αποτελεί ένα πρόβλημα με ποικίλες εφαρμογές και τρόπους εξερεύνησης και επομένως αξίζει να μελετηθεί ακόμα περισσότερο.
author2 Yfanti, Konstantina
author_facet Yfanti, Konstantina
Υφαντή, Κωνσταντίνα
author Υφαντή, Κωνσταντίνα
author_sort Υφαντή, Κωνσταντίνα
title Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
title_short Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
title_full Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
title_fullStr Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
title_full_unstemmed Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
title_sort ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης
publishDate 2022
url https://hdl.handle.net/10889/23548
work_keys_str_mv AT yphantēkōnstantina anakataskeuēeikonasypsēlēsanalysēsapoeikoneschamēlēsanalysēsmetechnikesmēchanikēsmathēsēs
AT yphantēkōnstantina highresolutionimagereconstructionfromlowresolutionimageswithmachinelearningtechniques
_version_ 1771297342671028224
spelling nemertes-10889-235482022-11-01T04:37:37Z Ανακατασκευή εικόνας υψηλής ανάλυσης από εικόνες χαμηλής ανάλυσης με τεχνικές μηχανικής μάθησης High resolution image reconstruction from low resolution images with machine learning techniques Υφαντή, Κωνσταντίνα Yfanti, Konstantina Υπολογιστική όραση Υπερανάλυση εικόνων Μηχανική μάθηση Θεωρία εκτίμησης Νευρωνικά δίκτυα Computer vision Super-resolution Machine learning Estimation theory Neural networks Στην παρούσα Διπλωματική Εργασία θα ασχοληθούμε με το πρόβλημα της Υπερανάλυσης (Super Resolution) εικόνων, το πλήθος τεχνικών που υπάρχουν και τις δυσκολίες που καλούμαστε να αντιμετωπίσουμε. Οι μέθοδοι βελτίωσης του οπτικού περιεχομένου εικόνων και βίντεο μας απασχολεί όλο και περισσότερο τα τελευταία χρόνια. Η ραγδαία εξέλιξη της τεχνολογίας, αυξάνει διαρκώς τις απαιτήσεις του κοινού για περιεχόμενο υψηλής ποιότητας. Εκτός, όμως, από εμπορικές εφαρμογές, οι μέθοδοι υπερανάλυσης αποτελούν χρήσιμο εργαλείο και σε άλλους κλάδους. Σε περιπτώσεις παρακολούθησης [1], είναι αναγκαίο το υλικό που λαμβάνουμε από τις συσκευές καταγραφής να διευκολύνει στην αναγνώριση και ταυτοποίηση προσώπων ή οχημάτων. Στις συγκεκριμένες περιπτώσεις, μάλιστα, συχνά χρειάζεται η βελτίωση του υλικού να γίνεται σε πραγματικό χρόνο και όχι με κάποια μεταγενέστερη επεξεργασία. Επίσης, σε τομείς της ιατρικής [2], όπως η ακτινολογία, χρειάζονται απεικονίσεις υψηλής ποιότητας που θα συμβάλλουν στην ακριβέστερη διάγνωση των ασθενών. Μεγάλη χρησιμότητα βρίσκει, επιπλέον, σε εφαρμογές του χώρου της αστρονομίας [3] και τηλεπισκόπησης [4], ορισμένες εκ των οποίων είναι η ταξινόμηση ουράνιων σωμάτων ή αντικειμένων και η βελτίωση ληφθέντων παρατηρήσεων. Αυτά είναι μερικά από τα παραδείγματα που αξίζει να αναφέρουμε, ωστόσο μπορούμε να καταλάβουμε πως οι απαιτήσεις δεν τελειώνουν εκεί. Ο όρος υπερανάλυση αναφέρεται σε μια οικογένεια τεχνικών, που έχει στόχο όχι μόνο να αυξήσει την ανάλυση, αλλά να βελτιώσει γενικά την ποιότητα εικόνων, σε μεγαλύτερο βαθμό από τις κλασικές τεχνικές επεξεργασίας εικόνας. Τέτοιες τεχνικές, είναι η εφαρμογή κάποιου είδους παρεμβολής σε συνδυασμό με μεθόδους που θα αυξήσουν τις υψηλές συχνότητες στην εικόνα. Αντίθετα, οι τεχνικές υπερανάλυσης φιλοδοξούν να εκτιμήσουν και να ανακατασκευάσουν την πληροφορία που χάθηκε μέσω της διαδικασίας απεικόνισης. Για τον σκοπό αυτό έχουν προταθεί δύο βασικές προσεγγίσεις: multi – frame super resolution και single image super resolution. Στην πρώτη περίπτωση, βασιζόμαστε σε ένα σύνολο παρατηρήσεων χαμηλής ανάλυσης της ίδιας σκηνής, οι οποίες δεν είναι ευθυγραμμισμένες μεταξύ τους. Συνδυάζοντας τις παρατηρήσεις σε μια εικόνα υψηλής ανάλυσης, θα προκύψει νέα πληροφορία που δεν υπήρχε σε κάθε μια από τις προηγούμενες ξεχωριστά. Η δεύτερη περίπτωση αποτελεί δυσκολότερο πρόβλημα, καθώς θέλουμε να δημιουργήσουμε νέες λεπτομέρειες έχοντας την λιγότερη δυνατή πληροφορία. Λύση σε αυτό το πρόβλημα δίνεται, συνήθως, μέσω τεχνικών μηχανικής μάθησης. Τα βασικά προβλήματα που καλείται να ξεπεράσει κάθε μέθοδος υπερανάλυσης είναι ο θόρυβος, το θόλωμα και η δειγματοληψία. Το είδος υποβάθμισης που έχουν υποστεί οι παρατηρήσεις μας, αλλάζει ανάλογα την εφαρμογή και την διαδικασία απεικόνισης. Λόγω αυτής της ευαισθησίας, καταλαβαίνουμε ότι υπάρχει πλήθως θεωρητικών αλλά και πρακτικών περιορισμών, διότι πολλές φορές η λύση του προβλήματος είναι αδύνατη ή συγκεκριμένη για τη διαδικασία για την οποία σχεδιάστηκε, χωρίς εύκολο περιθώριο γενίκευσης. Ανεξάρτητα από την προσέγγιση που ακολουθούμε, μπορούμε να χωρίσουμε τις τεχνικές, ευρέως, σε δύο κατηγορίες: τις κλασικές, τεχνικές, δηλαδή, που υπάρχουν εδώ και δεκαετίες και βασίζονται σε γνώσεις στατιστικής και κλασικής επεξεργασίας σημάτων και τις μεθόδους βαθειάς μάθησης, που αναπτύχθηκαν τα τελευταία χρόνια με την άνοδο των τεχνητών νευρωνικών δικτύων. Οι τελευταίες, μάλιστα, φαίνεται να ξεπερνούν σε απόδοση τους προκάτοχούς τους. Ως αποτέλεσμα, η πλειονότητα των σύγχρονων μεθόδων βασίζεται σε μοντέλα βαθειάς μάθησης που χρησιμοποιούν τα δεδομένα για να ανακατασκευάσουν την απαραίτητη πληροφορία. Γίνεται σαφές, λοιπόν, πως το συγκεκριμένο, αποτελεί ένα πρόβλημα με ποικίλες εφαρμογές και τρόπους εξερεύνησης και επομένως αξίζει να μελετηθεί ακόμα περισσότερο. - 2022-10-31T10:12:04Z 2022-10-31T10:12:04Z 2022-10 https://hdl.handle.net/10889/23548 el Attribution-NonCommercial-ShareAlike 3.0 United States http://creativecommons.org/licenses/by-nc-sa/3.0/us/ application/pdf