Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό

Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μπουλασίκης, Μιχαήλ
Άλλοι συγγραφείς: Boulasikis, Michael
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14680
id nemertes-10889-14680
record_format dspace
spelling nemertes-10889-146802022-09-05T14:07:48Z Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό Algorithms of machine/deep learning and/or hardware/software implementations Μπουλασίκης, Μιχαήλ Boulasikis, Michael Μηχανική μάθηση Υπολογιστική όραση Ενσωματωμένα συστήματα Συνελικτικά νευρωνικά δίκτυα Συστοιχία επιτόπια προγραμματιζόμενων πυλών Deep learning Computer vision Embedded systems FPGA Convolutional neural networks Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στην ανακάλυψη και την μέτρηση των βασικών σημείων συμφόρησης του συστήματος και το πόσο βοηθάνε βελτιστοποιήσεις σε επίπεδο hardware. Αρχικά παρουσιάζεται μια μικρή αλλά σημαντική εισαγωγή στις έννοιες-κλειδιά που διαπραγματεύεται η εργασία όπως η Μηχανική Μάθηση και τα Ενσωματωμένα Συστήματα. Ύστερα γίνεται μια πλήρη θεωρητική περιγραφή των βελτιστοποιήσεων μαζί με ανάλυση πρακτικών θεμάτων. Δίνεται έμφαση στις αλγοριθμικές βελτιστοποιήσεις, στον παραλληλισμό, στον κβαντισμό των δεδομένων και την διαχείριση της μνήμης του συστήματος. Τέλος, παρουσιάζονται τα συμπεράσματα και οι πρακτικές μετρήσεις. Κλείνοντας, καταλήγουμε στο συμπέρασμα ότι κύριο εμπόδιο της ταχύτητας του συστήματος είναι η μνήμη και ότι η σχεδίαση ειδικού υλικού και πολυεπίπεδων βελτιστοποιήσεων μπορούν να χρησιμοποιηθούν προκειμένου να ελαχιστοποιηθεί ο χρόνος εκτέλεσης, η χρήση μνήμης και πόρων καθώς και η κατανάλωση ισχύος του συστήματος. This work presents an attempt to efficiently package some of the problem solving power of modern computer vision algorithms in an embedded system, in particular the design and optimization of a Convolutional Neural Network layer in an embedded environment, which includes a low-power CPU and programmable logic in the form of an FPGA. The core of this thesis focuses on determining and measuring the key bottlenecks of the system as well as the speed-ups each optimization achieves. First, there is a short but necessary review of key concepts such as machine learning and embedded systems. Then, the theoretical background for each optimization is introduced in detail along with practical considerations. Emphasis is given on algorithmic speed-ups, parallelism, data quantization and memory management. Finally, the conclusions as well as the measurements are presented along with examples. We conclude that the primary bottleneck of a CNN algorithm implemented in an embedded system is memory and that hardware design and optimizations can be used to improve the throughput and efficiency of CNNs to a varying extend while maintaining power consumption and resource utilization to a minimum. 2021-03-12T07:21:16Z 2021-03-12T07:21:16Z 2021-03-05 http://hdl.handle.net/10889/14680 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μηχανική μάθηση
Υπολογιστική όραση
Ενσωματωμένα συστήματα
Συνελικτικά νευρωνικά δίκτυα
Συστοιχία επιτόπια προγραμματιζόμενων πυλών
Deep learning
Computer vision
Embedded systems
FPGA
Convolutional neural networks
spellingShingle Μηχανική μάθηση
Υπολογιστική όραση
Ενσωματωμένα συστήματα
Συνελικτικά νευρωνικά δίκτυα
Συστοιχία επιτόπια προγραμματιζόμενων πυλών
Deep learning
Computer vision
Embedded systems
FPGA
Convolutional neural networks
Μπουλασίκης, Μιχαήλ
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
description Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στην ανακάλυψη και την μέτρηση των βασικών σημείων συμφόρησης του συστήματος και το πόσο βοηθάνε βελτιστοποιήσεις σε επίπεδο hardware. Αρχικά παρουσιάζεται μια μικρή αλλά σημαντική εισαγωγή στις έννοιες-κλειδιά που διαπραγματεύεται η εργασία όπως η Μηχανική Μάθηση και τα Ενσωματωμένα Συστήματα. Ύστερα γίνεται μια πλήρη θεωρητική περιγραφή των βελτιστοποιήσεων μαζί με ανάλυση πρακτικών θεμάτων. Δίνεται έμφαση στις αλγοριθμικές βελτιστοποιήσεις, στον παραλληλισμό, στον κβαντισμό των δεδομένων και την διαχείριση της μνήμης του συστήματος. Τέλος, παρουσιάζονται τα συμπεράσματα και οι πρακτικές μετρήσεις. Κλείνοντας, καταλήγουμε στο συμπέρασμα ότι κύριο εμπόδιο της ταχύτητας του συστήματος είναι η μνήμη και ότι η σχεδίαση ειδικού υλικού και πολυεπίπεδων βελτιστοποιήσεων μπορούν να χρησιμοποιηθούν προκειμένου να ελαχιστοποιηθεί ο χρόνος εκτέλεσης, η χρήση μνήμης και πόρων καθώς και η κατανάλωση ισχύος του συστήματος.
author2 Boulasikis, Michael
author_facet Boulasikis, Michael
Μπουλασίκης, Μιχαήλ
author Μπουλασίκης, Μιχαήλ
author_sort Μπουλασίκης, Μιχαήλ
title Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
title_short Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
title_full Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
title_fullStr Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
title_full_unstemmed Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
title_sort αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
publishDate 2021
url http://hdl.handle.net/10889/14680
work_keys_str_mv AT mpoulasikēsmichaēl algorithmoimēchanikēsbatheasmēchanikēsmathēsēsēkaiylopoiēseisseylikologismiko
AT mpoulasikēsmichaēl algorithmsofmachinedeeplearningandorhardwaresoftwareimplementations
_version_ 1771297252904534016