Στοίχιση φωτομετρικά παραμορφωμένων εικόνων
Το πεδίο της Υπολογιστικής Όρασης ασχολείται με το πως οι υπολογιστές βλέπουν και ερμηνεύουν μια εικόνα ή ισοδύναμα μια σκηνή. Σκοπός του είναι η κατανόηση και η αυτοματοποίηση των λειτουργιών του ανθρώπινου οπτικού συστήματος. Η ποικιλία των εφαρμογών του πεδίου είναι τεράστια και αυτή η διπλωματικ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/16438 |
id |
nemertes-10889-16438 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Υπολογιστική όραση Στοίχιση εικόνων Φωτομετρικές παραμορφώσεις Νευρωνικά δίκτυα Βελτιστοποίηση Βαθιά μάθηση Computer vision Image alignment Neural networks Deep learning |
spellingShingle |
Υπολογιστική όραση Στοίχιση εικόνων Φωτομετρικές παραμορφώσεις Νευρωνικά δίκτυα Βελτιστοποίηση Βαθιά μάθηση Computer vision Image alignment Neural networks Deep learning Γερογιάννης, Δημήτριος Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
description |
Το πεδίο της Υπολογιστικής Όρασης ασχολείται με το πως οι υπολογιστές βλέπουν και ερμηνεύουν μια εικόνα ή ισοδύναμα μια σκηνή. Σκοπός του είναι η κατανόηση και η αυτοματοποίηση των λειτουργιών του ανθρώπινου οπτικού συστήματος. Η ποικιλία των εφαρμογών του πεδίου είναι τεράστια και αυτή η διπλωματική εργασία επικεντρώνεται σε ένα θεμελιώδες πρόβλημα, το οποίο είναι η Στοίχιση Εικόνων. Στα πλαίσια της εργασίας, γίνεται παρουσίαση της πλειοψηφίας των προσεγγίσεων για την επίλυση του προβλήματος, με ιδιαίτερη έμφαση στην ανάλυση της ευρωστίας αυτών ως προς τις φωτομετρικές παραμορφώσεις. Παρουσιάζονται αναλυτικά οι παραδοσιακές τεχνικές οι οποίες αντιστοιχούν στην κλασική Υπολογιστική Όραση. Αυτές αφορούν τις ολικές τεχνικές οι οποίες λειτουργούν στο σύνολο των εικονοστοιχείων των προς στοίχιση εικόνων, οι οποίες ομαδοποιούνται με κριτήριο τη δυσκολία των φωτομετρικών παραμορφώσεων που διαχειρίζονται και τις προσεγγίσεις που βασίζονται στα χειροποίητα χαρακτηριστικά, οι οποίες από τη φύση τους αξιοποιούν μόνο ένα υποσύνολο των εικονοστοιχείων από κάθε εικόνα, τα οποία αντιστοιχούν σε σημεία με πλούσιο περιεχόμενο (χαρακτηριστικά). Η άνοδος της Βαθιάς Μάθησης έχει φέρει την επανάσταση στην Υπολογιστική Όραση και προφανώς για αυτό τον λόγο δε θα μπορούσε να μη γίνει αναφορά και σε προσεγγίσεις βαθιάς μάθησης. Αναλυτικότερα, περιγράφονται τεχνικές βασισμένες σε χαρακτηριστικά που εξάγονται από Συνελικτικά Νευρωνικά Δίκτυα, μέθοδοι που αντισταθμίζουν τις φωτομετρικές παραμορφώσεις μέσω ενός αμετάβλητου ως προς τον φωτισμό μετασχηματισμού εικόνων και επιπλέον μοντέρνες προσεγγίσεις που στοιχίζουν απευθείας δύο εικόνες μέσω κάποιου κατάλληλου νευρωνικού δικτύου βαθιάς αρχιτεκτονικής. Κατά την εκπόνηση της διπλωματικής εργασίας, έγινε έρευνα για την περίπτωση στοίχισης εικόνων υπό την παρουσία ισχυρών και ανομοιόμορφων τοπικών φωτομετρικών παραμορφώσεων, οι οποίες αποτελούν τη δυσκολότερη στη διαχείριση κατηγορία φωτομετρικών παραμορφώσεων. Για την επίλυση του προβλήματος, σχεδιάστηκε μια νέα ολική τεχνική στοίχισης, η οποία φαίνεται να είναι πολλά υποσχόμενη, καθώς έχει τα state of the art αποτελέσματα στη στοίχιση τοπικά φωτομετρικά παραμορφωμένων εικόνων. |
author2 |
Gerogiannis, Dimitrios |
author_facet |
Gerogiannis, Dimitrios Γερογιάννης, Δημήτριος |
author |
Γερογιάννης, Δημήτριος |
author_sort |
Γερογιάννης, Δημήτριος |
title |
Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
title_short |
Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
title_full |
Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
title_fullStr |
Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
title_full_unstemmed |
Στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
title_sort |
στοίχιση φωτομετρικά παραμορφωμένων εικόνων |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/16438 |
work_keys_str_mv |
AT gerogiannēsdēmētrios stoichisēphōtometrikaparamorphōmenōneikonōn AT gerogiannēsdēmētrios alignmentofphotometricallydistortedimages |
_version_ |
1771297313863499776 |
spelling |
nemertes-10889-164382022-09-05T20:26:08Z Στοίχιση φωτομετρικά παραμορφωμένων εικόνων Alignment of photometrically distorted images Γερογιάννης, Δημήτριος Gerogiannis, Dimitrios Υπολογιστική όραση Στοίχιση εικόνων Φωτομετρικές παραμορφώσεις Νευρωνικά δίκτυα Βελτιστοποίηση Βαθιά μάθηση Computer vision Image alignment Neural networks Deep learning Το πεδίο της Υπολογιστικής Όρασης ασχολείται με το πως οι υπολογιστές βλέπουν και ερμηνεύουν μια εικόνα ή ισοδύναμα μια σκηνή. Σκοπός του είναι η κατανόηση και η αυτοματοποίηση των λειτουργιών του ανθρώπινου οπτικού συστήματος. Η ποικιλία των εφαρμογών του πεδίου είναι τεράστια και αυτή η διπλωματική εργασία επικεντρώνεται σε ένα θεμελιώδες πρόβλημα, το οποίο είναι η Στοίχιση Εικόνων. Στα πλαίσια της εργασίας, γίνεται παρουσίαση της πλειοψηφίας των προσεγγίσεων για την επίλυση του προβλήματος, με ιδιαίτερη έμφαση στην ανάλυση της ευρωστίας αυτών ως προς τις φωτομετρικές παραμορφώσεις. Παρουσιάζονται αναλυτικά οι παραδοσιακές τεχνικές οι οποίες αντιστοιχούν στην κλασική Υπολογιστική Όραση. Αυτές αφορούν τις ολικές τεχνικές οι οποίες λειτουργούν στο σύνολο των εικονοστοιχείων των προς στοίχιση εικόνων, οι οποίες ομαδοποιούνται με κριτήριο τη δυσκολία των φωτομετρικών παραμορφώσεων που διαχειρίζονται και τις προσεγγίσεις που βασίζονται στα χειροποίητα χαρακτηριστικά, οι οποίες από τη φύση τους αξιοποιούν μόνο ένα υποσύνολο των εικονοστοιχείων από κάθε εικόνα, τα οποία αντιστοιχούν σε σημεία με πλούσιο περιεχόμενο (χαρακτηριστικά). Η άνοδος της Βαθιάς Μάθησης έχει φέρει την επανάσταση στην Υπολογιστική Όραση και προφανώς για αυτό τον λόγο δε θα μπορούσε να μη γίνει αναφορά και σε προσεγγίσεις βαθιάς μάθησης. Αναλυτικότερα, περιγράφονται τεχνικές βασισμένες σε χαρακτηριστικά που εξάγονται από Συνελικτικά Νευρωνικά Δίκτυα, μέθοδοι που αντισταθμίζουν τις φωτομετρικές παραμορφώσεις μέσω ενός αμετάβλητου ως προς τον φωτισμό μετασχηματισμού εικόνων και επιπλέον μοντέρνες προσεγγίσεις που στοιχίζουν απευθείας δύο εικόνες μέσω κάποιου κατάλληλου νευρωνικού δικτύου βαθιάς αρχιτεκτονικής. Κατά την εκπόνηση της διπλωματικής εργασίας, έγινε έρευνα για την περίπτωση στοίχισης εικόνων υπό την παρουσία ισχυρών και ανομοιόμορφων τοπικών φωτομετρικών παραμορφώσεων, οι οποίες αποτελούν τη δυσκολότερη στη διαχείριση κατηγορία φωτομετρικών παραμορφώσεων. Για την επίλυση του προβλήματος, σχεδιάστηκε μια νέα ολική τεχνική στοίχισης, η οποία φαίνεται να είναι πολλά υποσχόμενη, καθώς έχει τα state of the art αποτελέσματα στη στοίχιση τοπικά φωτομετρικά παραμορφωμένων εικόνων. The scientific field of Computer Vision is all about how computers see and interpret a picture or equivalently a scene. Its focus lies on the understanding and automation of the tasks related to the human visual system. The variety of application of the field is vast and this diploma thesis focuses on a fundamental problem, which is Image Alignment. In the context of this work, the majority of approaches to solve the problem are presented with a particular emphasis given on the analysis of their robustness against photometric distortions. The traditional techniques corresponding to classical Computer Vision are presented in detail. These concern direct techniques that operate using all the pixels of both images, which are categorized based on the difficulty of the photometric distortions they manage and the feature-based approaches that use handcrafted features, which use a subset of pixels from each image, that correspond to points with rich content (features). The rise of Deep Learning has revolutionized Computational Vision and obviously for this reason deep learning approaches could not be left out. In more detail, techniques based on features extracted from Convolutional Neural Networks, methods that compensate for photometric distortions via an illumination-invariant image transform and additional modern approaches that directly align two images using a suitable deep neural network are described. During the preparation of the thesis, research was conducted on the case of image alignment in the presence of severe and non-uniform local photometric distortions, which are the most difficult to manage class of photometric distortions. To solve the problem, a new global alignment technique was designed, which appears to be promising, as it yields state of the art results on the alignment of locally photometrically distorted images. 2022-07-11T06:30:54Z 2022-07-11T06:30:54Z 2022-07-08 http://hdl.handle.net/10889/16438 gr application/pdf |