Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό
Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στη...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14680 |
id |
nemertes-10889-14680 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-146802022-09-05T14:07:48Z Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό Algorithms of machine/deep learning and/or hardware/software implementations Μπουλασίκης, Μιχαήλ Boulasikis, Michael Μηχανική μάθηση Υπολογιστική όραση Ενσωματωμένα συστήματα Συνελικτικά νευρωνικά δίκτυα Συστοιχία επιτόπια προγραμματιζόμενων πυλών Deep learning Computer vision Embedded systems FPGA Convolutional neural networks Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στην ανακάλυψη και την μέτρηση των βασικών σημείων συμφόρησης του συστήματος και το πόσο βοηθάνε βελτιστοποιήσεις σε επίπεδο hardware. Αρχικά παρουσιάζεται μια μικρή αλλά σημαντική εισαγωγή στις έννοιες-κλειδιά που διαπραγματεύεται η εργασία όπως η Μηχανική Μάθηση και τα Ενσωματωμένα Συστήματα. Ύστερα γίνεται μια πλήρη θεωρητική περιγραφή των βελτιστοποιήσεων μαζί με ανάλυση πρακτικών θεμάτων. Δίνεται έμφαση στις αλγοριθμικές βελτιστοποιήσεις, στον παραλληλισμό, στον κβαντισμό των δεδομένων και την διαχείριση της μνήμης του συστήματος. Τέλος, παρουσιάζονται τα συμπεράσματα και οι πρακτικές μετρήσεις. Κλείνοντας, καταλήγουμε στο συμπέρασμα ότι κύριο εμπόδιο της ταχύτητας του συστήματος είναι η μνήμη και ότι η σχεδίαση ειδικού υλικού και πολυεπίπεδων βελτιστοποιήσεων μπορούν να χρησιμοποιηθούν προκειμένου να ελαχιστοποιηθεί ο χρόνος εκτέλεσης, η χρήση μνήμης και πόρων καθώς και η κατανάλωση ισχύος του συστήματος. This work presents an attempt to efficiently package some of the problem solving power of modern computer vision algorithms in an embedded system, in particular the design and optimization of a Convolutional Neural Network layer in an embedded environment, which includes a low-power CPU and programmable logic in the form of an FPGA. The core of this thesis focuses on determining and measuring the key bottlenecks of the system as well as the speed-ups each optimization achieves. First, there is a short but necessary review of key concepts such as machine learning and embedded systems. Then, the theoretical background for each optimization is introduced in detail along with practical considerations. Emphasis is given on algorithmic speed-ups, parallelism, data quantization and memory management. Finally, the conclusions as well as the measurements are presented along with examples. We conclude that the primary bottleneck of a CNN algorithm implemented in an embedded system is memory and that hardware design and optimizations can be used to improve the throughput and efficiency of CNNs to a varying extend while maintaining power consumption and resource utilization to a minimum. 2021-03-12T07:21:16Z 2021-03-12T07:21:16Z 2021-03-05 http://hdl.handle.net/10889/14680 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Υπολογιστική όραση Ενσωματωμένα συστήματα Συνελικτικά νευρωνικά δίκτυα Συστοιχία επιτόπια προγραμματιζόμενων πυλών Deep learning Computer vision Embedded systems FPGA Convolutional neural networks |
spellingShingle |
Μηχανική μάθηση Υπολογιστική όραση Ενσωματωμένα συστήματα Συνελικτικά νευρωνικά δίκτυα Συστοιχία επιτόπια προγραμματιζόμενων πυλών Deep learning Computer vision Embedded systems FPGA Convolutional neural networks Μπουλασίκης, Μιχαήλ Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
description |
Αυτή η εργασία παρουσιάζει μια απόπειρα να αξιοποιηθεί ένα κομμάτι της δύναμης που έχουν οι νέοι αλγόριθμοι Computer Vision σε ένα ενσωματωμένο σύστημα το οποίο περιέχει έναν επεξεργαστή ARM χαμηλής κατανάλωσης και προγραμματιζόμενη λογική υπό τη μορφή FPGA. Ο πυρήνας αυτής της εργασίας εστιάζει στην ανακάλυψη και την μέτρηση των βασικών σημείων συμφόρησης του συστήματος και το πόσο βοηθάνε βελτιστοποιήσεις σε επίπεδο hardware. Αρχικά παρουσιάζεται μια μικρή αλλά σημαντική εισαγωγή στις έννοιες-κλειδιά που διαπραγματεύεται η εργασία όπως η Μηχανική Μάθηση και τα Ενσωματωμένα Συστήματα. Ύστερα γίνεται μια πλήρη θεωρητική περιγραφή των βελτιστοποιήσεων μαζί με ανάλυση πρακτικών θεμάτων. Δίνεται έμφαση στις αλγοριθμικές βελτιστοποιήσεις, στον παραλληλισμό, στον κβαντισμό των δεδομένων και την διαχείριση της μνήμης του συστήματος. Τέλος, παρουσιάζονται τα συμπεράσματα και οι πρακτικές μετρήσεις. Κλείνοντας, καταλήγουμε στο συμπέρασμα ότι κύριο εμπόδιο της ταχύτητας του συστήματος είναι η μνήμη και ότι η σχεδίαση ειδικού υλικού και πολυεπίπεδων βελτιστοποιήσεων μπορούν να χρησιμοποιηθούν προκειμένου να ελαχιστοποιηθεί ο χρόνος εκτέλεσης, η χρήση μνήμης και πόρων καθώς και η κατανάλωση ισχύος του συστήματος. |
author2 |
Boulasikis, Michael |
author_facet |
Boulasikis, Michael Μπουλασίκης, Μιχαήλ |
author |
Μπουλασίκης, Μιχαήλ |
author_sort |
Μπουλασίκης, Μιχαήλ |
title |
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
title_short |
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
title_full |
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
title_fullStr |
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
title_full_unstemmed |
Αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
title_sort |
αλγόριθμοι μηχανικής/βαθέας μηχανικής μάθησης ή/και υλοποιήσεις σε υλικό/λογισμικό |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14680 |
work_keys_str_mv |
AT mpoulasikēsmichaēl algorithmoimēchanikēsbatheasmēchanikēsmathēsēsēkaiylopoiēseisseylikologismiko AT mpoulasikēsmichaēl algorithmsofmachinedeeplearningandorhardwaresoftwareimplementations |
_version_ |
1771297252904534016 |