Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα

Τα νευρωνικά δίκτυα και η τεχνητή νοημοσύνη αποτελούν πλέον μέρος της καθημερινότητας όλων μας και φαίνεται να αποτελούν λύση για πολλά προβλήματα όπου αυστηρός προγραμματισμός και καθορισμός λύσης είναι από πολύ δύσκολος έως αδύνατος. Παραδείγματα τέτοιων εφαρμογών αποτελούν η αναγνώριση προσώπου ή...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κόσσυφας, Σταύρος
Άλλοι συγγραφείς: Kossyfas, Stavros
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23465
id nemertes-10889-23465
record_format dspace
spelling nemertes-10889-234652022-10-20T03:35:49Z Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα Hardware architectures for accelerating deep learning techniques in integrated systems Κόσσυφας, Σταύρος Kossyfas, Stavros Βαθιά Μάθηση, Τεχνητή Νοημοσύνη, FPGA, Mobilenet, Τεχνητή νοημοσύνη Επιταχυντές υλικού Ενσωματωμένα συστήματα Deep Learning, Artificial Intelligence, FPGA, , , Artificial intelligence Mobilenet Hardware accelerators Integrated systems Τα νευρωνικά δίκτυα και η τεχνητή νοημοσύνη αποτελούν πλέον μέρος της καθημερινότητας όλων μας και φαίνεται να αποτελούν λύση για πολλά προβλήματα όπου αυστηρός προγραμματισμός και καθορισμός λύσης είναι από πολύ δύσκολος έως αδύνατος. Παραδείγματα τέτοιων εφαρμογών αποτελούν η αναγνώριση προσώπου ή αντικειμένου (classification) για ξεκλείδωμα με αναγνώριση προσώπου σε υπολογιστές και κινητά, ή ο εντοπισμός αντικειμένων και η εκτίμηση της απόστασης αυτών από το σημείο παρατήρησης. Λόγω του τεράστιου όγκου των εφαρμογών για τις οποίες επιστρατεύονται τα νευρωνικά δίκτυα, πολλές φορές η υλοποίηση αυτών περιορίζεται από τις ανάγκες της κάθε εφαρμογής, αλλά και τις ικανότητες της συσκευής που είναι διαθέσιμη για επιστράτευση της ανάλογης μεθόδου. Κάρτες γραφικών με πολλαπλούς πυρήνες και μεγάλη υπολογιστική ισχύ, παρότι είναι πολύ χρήσιμες για την ανάπτυξη και την εκπαίδευση τέτοιων δικτύων, είναι ακριβές, ογκώδεις και ενεργοβόρες, ενώ συχνά δεν αποτελούν καν επιλογή, όπως για παράδειγμα σε κινητές συσκευές με αυστηρά καθορισμένα περιθώρια διαστάσεων και χωρητικότητας μπαταρίας. Στην παρούσα εργασία θα παρουσιαστεί ένας επιταχυντής υλικού για ένα συνελικτικό νευρωνικό δίκτυο, το Mobilenet V3. Η απόδοση του επιταχυντή θα μετρηθεί σύμφωνα με τα διάφορα metrics που αξιολογείται το αρχικό software μοντέλο (accuracy, certainty…), αλλά και σε σχέση με τη χρονική απόκρισή του (latency) και θα γίνει σύγκριση των επιδόσεών του με άλλες υλοποιήσεις που έχουν προταθεί στην επιστημονική κοινότητα. Ακόμα θα παρουσιαστεί πώς η υλοποίηση του νευρωνικού μοντέλου αντιστοιχίστηκε στο υλικό και πώς βελτιστοποιήθηκε ώστε να παρατηρηθεί η τελική απόδοση. Neural networks and artificial intelligence are well established in everyone’s everyday lives and they seem to provide solutions to problems where absolut programming and definition of a solution is at least very hard if not impossible. Examples of such applications are facial or object recognition (classification) for unlocking devices like laptops or cell phones, or object detection and distance estimation between the target and the point of observation. Due to the immense volume of applications for which neural networks are deployed, their implementation is often dictated by the the needs of each specific application, as well as the computation capabilities of the device on which the neural network will be deployed. Multicore GPUs provide great computational resources and they are very useful for training such networks, but they are also expensive, bulky and energy hungry, while often times they are not even an option, like for instance in mobile devices with strictly determined spatial dimensions and battery capacities. The current thesis proposes a hardware accelerator for MobileNet V3 Large, a convolutional neural network proposed by Google. The performance of the accelerator will be measured according to different metrics used to evaluate neural networks (i.e. accuracy, certainty…) and it will be compared to the performance of other architectures proposed by the engineering community. The way in which the software network is modeled in hardware and optimized in order to observe its measured performance will also be explained within this document. 2022-10-19T12:25:11Z 2022-10-19T12:25:11Z 2022-10-18 https://hdl.handle.net/10889/23465 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Βαθιά Μάθηση, Τεχνητή Νοημοσύνη, FPGA, Mobilenet,
Τεχνητή νοημοσύνη
Επιταχυντές υλικού
Ενσωματωμένα συστήματα
Deep Learning, Artificial Intelligence, FPGA, , ,
Artificial intelligence
Mobilenet
Hardware accelerators
Integrated systems
spellingShingle Βαθιά Μάθηση, Τεχνητή Νοημοσύνη, FPGA, Mobilenet,
Τεχνητή νοημοσύνη
Επιταχυντές υλικού
Ενσωματωμένα συστήματα
Deep Learning, Artificial Intelligence, FPGA, , ,
Artificial intelligence
Mobilenet
Hardware accelerators
Integrated systems
Κόσσυφας, Σταύρος
Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
description Τα νευρωνικά δίκτυα και η τεχνητή νοημοσύνη αποτελούν πλέον μέρος της καθημερινότητας όλων μας και φαίνεται να αποτελούν λύση για πολλά προβλήματα όπου αυστηρός προγραμματισμός και καθορισμός λύσης είναι από πολύ δύσκολος έως αδύνατος. Παραδείγματα τέτοιων εφαρμογών αποτελούν η αναγνώριση προσώπου ή αντικειμένου (classification) για ξεκλείδωμα με αναγνώριση προσώπου σε υπολογιστές και κινητά, ή ο εντοπισμός αντικειμένων και η εκτίμηση της απόστασης αυτών από το σημείο παρατήρησης. Λόγω του τεράστιου όγκου των εφαρμογών για τις οποίες επιστρατεύονται τα νευρωνικά δίκτυα, πολλές φορές η υλοποίηση αυτών περιορίζεται από τις ανάγκες της κάθε εφαρμογής, αλλά και τις ικανότητες της συσκευής που είναι διαθέσιμη για επιστράτευση της ανάλογης μεθόδου. Κάρτες γραφικών με πολλαπλούς πυρήνες και μεγάλη υπολογιστική ισχύ, παρότι είναι πολύ χρήσιμες για την ανάπτυξη και την εκπαίδευση τέτοιων δικτύων, είναι ακριβές, ογκώδεις και ενεργοβόρες, ενώ συχνά δεν αποτελούν καν επιλογή, όπως για παράδειγμα σε κινητές συσκευές με αυστηρά καθορισμένα περιθώρια διαστάσεων και χωρητικότητας μπαταρίας. Στην παρούσα εργασία θα παρουσιαστεί ένας επιταχυντής υλικού για ένα συνελικτικό νευρωνικό δίκτυο, το Mobilenet V3. Η απόδοση του επιταχυντή θα μετρηθεί σύμφωνα με τα διάφορα metrics που αξιολογείται το αρχικό software μοντέλο (accuracy, certainty…), αλλά και σε σχέση με τη χρονική απόκρισή του (latency) και θα γίνει σύγκριση των επιδόσεών του με άλλες υλοποιήσεις που έχουν προταθεί στην επιστημονική κοινότητα. Ακόμα θα παρουσιαστεί πώς η υλοποίηση του νευρωνικού μοντέλου αντιστοιχίστηκε στο υλικό και πώς βελτιστοποιήθηκε ώστε να παρατηρηθεί η τελική απόδοση.
author2 Kossyfas, Stavros
author_facet Kossyfas, Stavros
Κόσσυφας, Σταύρος
author Κόσσυφας, Σταύρος
author_sort Κόσσυφας, Σταύρος
title Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
title_short Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
title_full Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
title_fullStr Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
title_full_unstemmed Αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
title_sort αρχιτεκτονικές υλικού για επιτάχυνση τεχνικών deep learning σε ενσωματωμένα συστήματα
publishDate 2022
url https://hdl.handle.net/10889/23465
work_keys_str_mv AT kossyphasstauros architektonikesylikougiaepitachynsētechnikōndeeplearningseensōmatōmenasystēmata
AT kossyphasstauros hardwarearchitecturesforacceleratingdeeplearningtechniquesinintegratedsystems
_version_ 1771297249450524672