Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων

Λόγω της ικανότητας τους να ιχνηλατούν texture-less αντικείμενα σε παραγεμισμένες σκηνές, χρησιμοποιώντας απλώς μονοοπτική RGB κάμερα, οι region-based ιχνηλάτες έχουν γίνει ιδιαίτερα δημοφιλείς. Στην παρούσα διπλωματική εργασία παρουσιάζεται ένας regionbased RGB ιχνηλάτης γνωστών τρισδιάστατων αντ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κατσαντάς, Ιωάννης
Άλλοι συγγραφείς: Katsantas, Ioannis
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15424
id nemertes-10889-15424
record_format dspace
spelling nemertes-10889-154242022-09-05T20:24:14Z Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων 3D object tracking and pose recovery using RGB histograms Κατσαντάς, Ιωάννης Katsantas, Ioannis Ιχνηλάτηση 3D αντικειμένων Εκτίμηση πόζας Κατάτμηση εικόνας 3D object tracking Pose estimation Image segmentation Level set methods Λόγω της ικανότητας τους να ιχνηλατούν texture-less αντικείμενα σε παραγεμισμένες σκηνές, χρησιμοποιώντας απλώς μονοοπτική RGB κάμερα, οι region-based ιχνηλάτες έχουν γίνει ιδιαίτερα δημοφιλείς. Στην παρούσα διπλωματική εργασία παρουσιάζεται ένας regionbased RGB ιχνηλάτης γνωστών τρισδιάστατων αντικειμένων που είναι ικανός να τρέξει, σε πραγματικό χρόνο, για μεγάλο αριθμό αντικειμένων. Προτείνεται ένας προσεγγιστικός υπολογισμός σε ένα από τα πιο υπολογιστικά βαριά βήματα των σχετικών μεθόδων, που είναι σε θέση να αυξήσει την ταχύτητα τους μέχρι και μία τάξη μεγέθους, ανάλογα με την επιθυμητή ακρίβεια. Για ακρίβεια αντίστοιχη με των state-of-the-art, ο αλγόριθμος που θα υλοποιηθεί τρέχει τουλάχιστον δύο φορές πιο γρήγορα από την τρέχουσα γρηγορότερη μέθοδο. Επιπρόσθετα, προτείνεται μία λύση για την ειδική κατηγορία του modeled occlusion που, σε αντίθεση με τις άλλες μεθόδους, δεν χρησιμοποιεί GPU και είναι πέντε φορές γρηγορότερη. ΄Ολα τα παραπάνω επιτυγχάνονται με τη χρήση μόλις μίας CPU. Τέλος, για να επαναφέρεται η ιχνηλάτηση όταν χάνεται το αντικείμενο, ο ιχνηλάτης εισάγεται στο ενδιάμεσο στάδιο μίας υπάρχουσας template matching διαδικασίας για τα τελευταία βήματα ενός εκτιμητή πόζας. Για τη διαδικασία αυτή, ο ιχνηλάτης προσαρμόζεται με υπάρχοντα μοντέλα για πιο αυστηρό segmentation, ενώ διορθώνεται κατάλληλα η σχετική με το matching training διαδικασία για να ταιριάξει με τον ιχνηλάτη της εργασίας. In this thesis we present a region-based RGB tracker for known 3D models which is capable of running in real-time for a large number of objects. We suggest an approximation during one of the most computationally costly steps of the related methods which can increase performance by one order of magnitude, depending on the level of desired accuracy. For accuracy similar to that of the state of the art, our algorithm runs at least two times faster than the currently fastest method. In addition, we present a solution for the special case of modeled occlusion which, contrary to the other existing solutions, doesn’t require a GPU and runs five times faster. Everything described is run on a single CPU core. Finally, in order to recover from tracking loss, the tracker is introduced into a later stage of an existing template matching process for the final steps of a pose estimator. To make this possible, the tracker is adjusted to use existing more advanced segmentation models, while the training process is changed accordingly to match with our tracker’s characteristics. 2021-10-21T11:28:08Z 2021-10-21T11:28:08Z 2021-10-21 http://hdl.handle.net/10889/15424 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ιχνηλάτηση 3D αντικειμένων
Εκτίμηση πόζας
Κατάτμηση εικόνας
3D object tracking
Pose estimation
Image segmentation
Level set methods
spellingShingle Ιχνηλάτηση 3D αντικειμένων
Εκτίμηση πόζας
Κατάτμηση εικόνας
3D object tracking
Pose estimation
Image segmentation
Level set methods
Κατσαντάς, Ιωάννης
Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
description Λόγω της ικανότητας τους να ιχνηλατούν texture-less αντικείμενα σε παραγεμισμένες σκηνές, χρησιμοποιώντας απλώς μονοοπτική RGB κάμερα, οι region-based ιχνηλάτες έχουν γίνει ιδιαίτερα δημοφιλείς. Στην παρούσα διπλωματική εργασία παρουσιάζεται ένας regionbased RGB ιχνηλάτης γνωστών τρισδιάστατων αντικειμένων που είναι ικανός να τρέξει, σε πραγματικό χρόνο, για μεγάλο αριθμό αντικειμένων. Προτείνεται ένας προσεγγιστικός υπολογισμός σε ένα από τα πιο υπολογιστικά βαριά βήματα των σχετικών μεθόδων, που είναι σε θέση να αυξήσει την ταχύτητα τους μέχρι και μία τάξη μεγέθους, ανάλογα με την επιθυμητή ακρίβεια. Για ακρίβεια αντίστοιχη με των state-of-the-art, ο αλγόριθμος που θα υλοποιηθεί τρέχει τουλάχιστον δύο φορές πιο γρήγορα από την τρέχουσα γρηγορότερη μέθοδο. Επιπρόσθετα, προτείνεται μία λύση για την ειδική κατηγορία του modeled occlusion που, σε αντίθεση με τις άλλες μεθόδους, δεν χρησιμοποιεί GPU και είναι πέντε φορές γρηγορότερη. ΄Ολα τα παραπάνω επιτυγχάνονται με τη χρήση μόλις μίας CPU. Τέλος, για να επαναφέρεται η ιχνηλάτηση όταν χάνεται το αντικείμενο, ο ιχνηλάτης εισάγεται στο ενδιάμεσο στάδιο μίας υπάρχουσας template matching διαδικασίας για τα τελευταία βήματα ενός εκτιμητή πόζας. Για τη διαδικασία αυτή, ο ιχνηλάτης προσαρμόζεται με υπάρχοντα μοντέλα για πιο αυστηρό segmentation, ενώ διορθώνεται κατάλληλα η σχετική με το matching training διαδικασία για να ταιριάξει με τον ιχνηλάτη της εργασίας.
author2 Katsantas, Ioannis
author_facet Katsantas, Ioannis
Κατσαντάς, Ιωάννης
author Κατσαντάς, Ιωάννης
author_sort Κατσαντάς, Ιωάννης
title Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
title_short Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
title_full Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
title_fullStr Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
title_full_unstemmed Ιχνηλάτηση 3D αντικειμένων και επαναφορά πόζας με χρήση RGB ιστογραμμάτων
title_sort ιχνηλάτηση 3d αντικειμένων και επαναφορά πόζας με χρήση rgb ιστογραμμάτων
publishDate 2021
url http://hdl.handle.net/10889/15424
work_keys_str_mv AT katsantasiōannēs ichnēlatēsē3dantikeimenōnkaiepanaphorapozasmechrēsērgbistogrammatōn
AT katsantasiōannēs 3dobjecttrackingandposerecoveryusingrgbhistograms
_version_ 1771297340176465920