Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers

Οι φωτογραφίες που λαμβάνονται με drone περιλαμβάνουν μια μεγάλη σειρά χαρακτηριστικών. Αυτά τα χαρακτηριστικά προβάλουν τεράστιες δυσκολίες για εφαρμογές που βασίζονται σε συνηθισμένα συνελικτικά δίκτυα. Πρόσφατες εργασίες πάνω σε Μετασχηματιστές όρασης έδειξαν πώς οι τοπολογίες μετασχηματιστών προ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Προκοπίου, Ιωάννης
Άλλοι συγγραφείς: Prokopiou, Ioannis
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25032
id nemertes-10889-25032
record_format dspace
spelling nemertes-10889-250322023-06-03T03:37:15Z Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers Learning strategies by imitation using vision transformers Προκοπίου, Ιωάννης Prokopiou, Ioannis Μίμηση Νευρωνικά Δίκτυα Ρομποτική Μετασχηματιστές όρασης Βαθειά μάθηση Τεχνητή νοημοσύνη Imitation learning Robotics Vision transformers Neural networks Deep learning Artificial intelligence Οι φωτογραφίες που λαμβάνονται με drone περιλαμβάνουν μια μεγάλη σειρά χαρακτηριστικών. Αυτά τα χαρακτηριστικά προβάλουν τεράστιες δυσκολίες για εφαρμογές που βασίζονται σε συνηθισμένα συνελικτικά δίκτυα. Πρόσφατες εργασίες πάνω σε Μετασχηματιστές όρασης έδειξαν πώς οι τοπολογίες μετασχηματιστών προσφέρουν πολλές δυνατότητες στο τομέα της όρασης των υπολογιστών. Αυτή η διπλωματική εργασία παρουσιάζει μια μέθοδο για την αυτόνομη πλοήγηση εναέριων drones κατά μήκος προκαθορισμένων μονοπατιών χρησιμοποιώντας μόνο οπτική είσοδο από κάμερες επί του σκάφους. Πιο συγκεκριμένα, δημιουργήσαμε και αξιολογήσαμε τρεις διακριτές αρχιτεκτονικές συστημάτων: ένα μοντέλο πολυστρωματικού perceptron, ένα συνελικτικό μοντέλο και ένα μοντέλο μετασχηματιστή όρασης. Χρησιμοποιώντας τον ελεγκτή PID και την εκμάθηση μίμησης για πλοήγηση, δημιουργήσαμε ένα σύνολο δεδομένων εκπαίδευσης. Τα ευρήματα των δοκιμών μας έδειξαν ότι τα μοντέλα συνέλιξης και μετασχηματιστή όρασης απέδωσαν καλύτερα από το μοντέλο πολυστρωματικού perceptron. Η έρευνά μας καταδεικνύει την ικανότητα της όρασης υπολογιστή και των μεθόδων βαθιάς μάθησης για τη βελτίωση της ακρίβειας και της ευρωστίας των συστημάτων πλοήγησης drone. Η ικανότητα ακριβούς και αξιόπιστης πλοήγησης σε περίπλοκο και δυναμικό περιβάλλον θα είναι πολύ σημαντική και χρήσιμη καθώς τα drones γίνονται πιο κοινά σε μια ποικιλία εφαρμογών. Photos taken with a drone include a wide range of features. These features present enormous difficulties for general applications based on conventional convolutional networks. Recent studies on Vision Transformers (ViT) has shown how transformer topologies offer many possibilities for computer vision. This thesis presents a method for autonomous navigation of aerial drones along predetermined paths using only visual input from on-board cameras. To be more precise, we created and assessed three distinct system architectures: a multilayer perceptron model, a convolutional model, and a vision transformer model. Using the PID controller and imitation learning for navigation, we created a training dataset. Our tests' findings demonstrated that the convolutional and vision transformer models performed better than the linear model. Our research demonstrates the promise of computer vision and deep learning methods for enhancing the precision and robustness of drone navigation systems. The capacity to precisely and dependably navigate in complicated and dynamic surroundings will be crucial as drones become more common in a variety of applications. 2023-06-02T10:42:45Z 2023-06-02T10:42:45Z 2023-06-02 https://hdl.handle.net/10889/25032 el CC0 1.0 Universal http://creativecommons.org/publicdomain/zero/1.0/ application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μίμηση
Νευρωνικά Δίκτυα
Ρομποτική
Μετασχηματιστές όρασης
Βαθειά μάθηση
Τεχνητή νοημοσύνη
Imitation learning
Robotics
Vision transformers
Neural networks
Deep learning
Artificial intelligence
spellingShingle Μίμηση
Νευρωνικά Δίκτυα
Ρομποτική
Μετασχηματιστές όρασης
Βαθειά μάθηση
Τεχνητή νοημοσύνη
Imitation learning
Robotics
Vision transformers
Neural networks
Deep learning
Artificial intelligence
Προκοπίου, Ιωάννης
Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
description Οι φωτογραφίες που λαμβάνονται με drone περιλαμβάνουν μια μεγάλη σειρά χαρακτηριστικών. Αυτά τα χαρακτηριστικά προβάλουν τεράστιες δυσκολίες για εφαρμογές που βασίζονται σε συνηθισμένα συνελικτικά δίκτυα. Πρόσφατες εργασίες πάνω σε Μετασχηματιστές όρασης έδειξαν πώς οι τοπολογίες μετασχηματιστών προσφέρουν πολλές δυνατότητες στο τομέα της όρασης των υπολογιστών. Αυτή η διπλωματική εργασία παρουσιάζει μια μέθοδο για την αυτόνομη πλοήγηση εναέριων drones κατά μήκος προκαθορισμένων μονοπατιών χρησιμοποιώντας μόνο οπτική είσοδο από κάμερες επί του σκάφους. Πιο συγκεκριμένα, δημιουργήσαμε και αξιολογήσαμε τρεις διακριτές αρχιτεκτονικές συστημάτων: ένα μοντέλο πολυστρωματικού perceptron, ένα συνελικτικό μοντέλο και ένα μοντέλο μετασχηματιστή όρασης. Χρησιμοποιώντας τον ελεγκτή PID και την εκμάθηση μίμησης για πλοήγηση, δημιουργήσαμε ένα σύνολο δεδομένων εκπαίδευσης. Τα ευρήματα των δοκιμών μας έδειξαν ότι τα μοντέλα συνέλιξης και μετασχηματιστή όρασης απέδωσαν καλύτερα από το μοντέλο πολυστρωματικού perceptron. Η έρευνά μας καταδεικνύει την ικανότητα της όρασης υπολογιστή και των μεθόδων βαθιάς μάθησης για τη βελτίωση της ακρίβειας και της ευρωστίας των συστημάτων πλοήγησης drone. Η ικανότητα ακριβούς και αξιόπιστης πλοήγησης σε περίπλοκο και δυναμικό περιβάλλον θα είναι πολύ σημαντική και χρήσιμη καθώς τα drones γίνονται πιο κοινά σε μια ποικιλία εφαρμογών.
author2 Prokopiou, Ioannis
author_facet Prokopiou, Ioannis
Προκοπίου, Ιωάννης
author Προκοπίου, Ιωάννης
author_sort Προκοπίου, Ιωάννης
title Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
title_short Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
title_full Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
title_fullStr Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
title_full_unstemmed Εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
title_sort εκμάθηση στρατηγικών μέσω μίμησης χρησιμοποιώντας vision transformers
publishDate 2023
url https://hdl.handle.net/10889/25032
work_keys_str_mv AT prokopiouiōannēs ekmathēsēstratēgikōnmesōmimēsēschrēsimopoiōntasvisiontransformers
AT prokopiouiōannēs learningstrategiesbyimitationusingvisiontransformers
_version_ 1771297293833601024