High level synthesis architectures of neural network to accelerate handwritten digit recognition
Neural networks have achieved impressive results in a wide range of applications. However, designing and optimizing neural networksfor hardware implementation can be a challenging task due to the complex computations involved. High level synthesis (HLS) is a promising approach that allows hardwar...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | English |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/25299 |
id |
nemertes-10889-25299 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
English |
topic |
High level synthesis Handwritten digit recognition acceleration Συνθεση υψηλού επιπέδου Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων |
spellingShingle |
High level synthesis Handwritten digit recognition acceleration Συνθεση υψηλού επιπέδου Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων Παπαδόπουλος, Παναγιώτης Βασίλειος High level synthesis architectures of neural network to accelerate handwritten digit recognition |
description |
Neural networks have achieved impressive results in a wide range of applications.
However, designing and optimizing neural networksfor hardware implementation can
be a challenging task due to the complex computations involved. High level synthesis
(HLS) is a promising approach that allows hardware designers to write high-level
descriptions of hardware circuits and automatically generate optimized low-level
hardware implementations.
In this diploma thesis, we investigate the use of HLS, with Vivado HLS framework, to
optimize a fully connected neural network for digit recognition. HLS is a design process
that takes as input an algorithmic description of a certain function, and outputs a
digital hardware implementation of the function. Specifically, we explore the use of
HLS tools to automatically generate hardware circuits that implement the neural
network, and to optimize the circuit for performance and area. We also investigate
the impact of various design choices, such as the number of layers and neurons and
techniques who affect the RTL implementation, on the performance of the optimized
circuit. There are four different architectures proposed including the Baseline.
Furthermore, through an exploration of different parameters of the model we arrive
at some interesting conclusions.
To evaluate the effectiveness of our approach, we compare the performance and the
FPGA’s utilization resources of the optimized circuit with that of a software-based
implementation of the neural network. Our results show that the HLS-generated
hardware circuit achieves significantly higher performance and lower power
consumption compared to the software-based implementation.
All implementations use the part xcvu35p-fsvh2892-1-e which belongs to the Virtex
UltraScale+ family and the period of the clock is set at 10 nanoseconds.
Overall, this diploma thesis demonstrates the potential of HLS for optimizing neural
networks for hardware implementation and provides insights into the design and
optimization of hardware circuits for machine learning applications. |
author2 |
Papadopoylos, Panagiotis Vasileios |
author_facet |
Papadopoylos, Panagiotis Vasileios Παπαδόπουλος, Παναγιώτης Βασίλειος |
author |
Παπαδόπουλος, Παναγιώτης Βασίλειος |
author_sort |
Παπαδόπουλος, Παναγιώτης Βασίλειος |
title |
High level synthesis architectures of neural network to accelerate handwritten digit recognition |
title_short |
High level synthesis architectures of neural network to accelerate handwritten digit recognition |
title_full |
High level synthesis architectures of neural network to accelerate handwritten digit recognition |
title_fullStr |
High level synthesis architectures of neural network to accelerate handwritten digit recognition |
title_full_unstemmed |
High level synthesis architectures of neural network to accelerate handwritten digit recognition |
title_sort |
high level synthesis architectures of neural network to accelerate handwritten digit recognition |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/25299 |
work_keys_str_mv |
AT papadopoulospanagiōtēsbasileios highlevelsynthesisarchitecturesofneuralnetworktoacceleratehandwrittendigitrecognition AT papadopoulospanagiōtēsbasileios architektonikessynthesēsypsēlouepipedouneurōnikoudiktyougiatēnepitachynsēanagnōrisēspsēphiōn |
_version_ |
1771297200386605056 |
spelling |
nemertes-10889-252992023-07-04T03:55:16Z High level synthesis architectures of neural network to accelerate handwritten digit recognition Αρχιτεκτονικές σύνθεσης υψηλού επιπέδου νευρωνικού δικτύου για την επιτάχυνση αναγνώρισης ψηφίων Παπαδόπουλος, Παναγιώτης Βασίλειος Papadopoylos, Panagiotis Vasileios High level synthesis Handwritten digit recognition acceleration Συνθεση υψηλού επιπέδου Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων Neural networks have achieved impressive results in a wide range of applications. However, designing and optimizing neural networksfor hardware implementation can be a challenging task due to the complex computations involved. High level synthesis (HLS) is a promising approach that allows hardware designers to write high-level descriptions of hardware circuits and automatically generate optimized low-level hardware implementations. In this diploma thesis, we investigate the use of HLS, with Vivado HLS framework, to optimize a fully connected neural network for digit recognition. HLS is a design process that takes as input an algorithmic description of a certain function, and outputs a digital hardware implementation of the function. Specifically, we explore the use of HLS tools to automatically generate hardware circuits that implement the neural network, and to optimize the circuit for performance and area. We also investigate the impact of various design choices, such as the number of layers and neurons and techniques who affect the RTL implementation, on the performance of the optimized circuit. There are four different architectures proposed including the Baseline. Furthermore, through an exploration of different parameters of the model we arrive at some interesting conclusions. To evaluate the effectiveness of our approach, we compare the performance and the FPGA’s utilization resources of the optimized circuit with that of a software-based implementation of the neural network. Our results show that the HLS-generated hardware circuit achieves significantly higher performance and lower power consumption compared to the software-based implementation. All implementations use the part xcvu35p-fsvh2892-1-e which belongs to the Virtex UltraScale+ family and the period of the clock is set at 10 nanoseconds. Overall, this diploma thesis demonstrates the potential of HLS for optimizing neural networks for hardware implementation and provides insights into the design and optimization of hardware circuits for machine learning applications. Τα νευρωνικά δίκτυα έχουν επιτύχει εντυπωσιακά αποτελέσματα σε ένα ευρύ φάσμα εφαρμογών. Ωστόσο, ο σχεδιασμός και η βελτιστοποίηση νευρωνικών δικτύων για εφαρμογή υλικού μπορεί είναι ένα δύσκολο έργο λόγω των περίπλοκων υπολογισμών που εμπλέκονται. Υψηλού επιπέδου σύνθεση (HLS) είναι μια πολλά υποσχόμενη προσέγγιση που επιτρέπει στους σχεδιαστές υλικού να γράφουν υψηλού επιπέδου περιγραφές κυκλωμάτων υλικού και να δημιουργούν αυτόματα βελτιστοποιημένο χαμηλού επιπέδου υλοποιήσεις υλικού. Σε αυτή τη διπλωματική εργασία, διερευνούμε τη χρήση του HLS, με το Vivado HLS framework, με στόχο την βελτιστοποίηση ενός πλήρως συνδεδεμένου νευρωνικού δικτύου για αναγνώριση ψηφίων. Το HLS είναι μια διαδικασία σχεδιασμού που λαμβάνει ως είσοδο μια αλγοριθμική περιγραφή μιας συγκεκριμένης συνάρτησης και βγάζει a ψηφιακό υλικό υλοποίηση της λειτουργίας. Συγκεκριμένα, διερευνούμε τη χρήση του HLS για την αυτόματη δημιουργία κυκλωμάτων υλικού που υλοποιούν το νευρικό δικτύου και για τη βελτιστοποίηση του κυκλώματος για απόδοση και περιοχή. Ερευνούμε επίσης τον αντίκτυπο των διαφόρων επιλογών σχεδιασμού, όπως ο αριθμός των στρωμάτων και των νευρώνων και τεχνικές που επηρεάζουν την υλοποίηση RTL, σχετικά με την απόδοση του βελτιστοποιημένου κυκλώματος. Υπάρχουν τέσσερις διαφορετικές αρχιτεκτονικές που προτείνονται, συμπεριλαμβανομένης της αρχιτεκτονικής αναφοράς. Επιπλέον, μέσα από μια διερεύνηση διαφορετικών παραμέτρων του μοντέλου φτάνουμε σε μερικά ενδιαφέροντα συμπεράσματα. Για να αξιολογήσουμε την αποτελεσματικότητα της προσέγγισής μας, συγκρίνουμε την απόδοση και την χρήση πόρων του FPGA του βελτιστοποιημένου κυκλώματος με εκείνου που ειναι βασισμένο σε λογισμικό. Τα αποτελέσματά μας δείχνουν ότι το κύκλωμα υλικού που δημιουργείται επιτυγχάνει σημαντικά υψηλότερη απόδοση και χαμηλότερη ισχύ κατανάλωσης σε σύγκριση με την εφαρμογή που βασίζεται σε λογισμικό. Όλες οι υλοποιήσεις χρησιμοποιούν την συσκευή xcvu35p-fsvh2892-1-e που ανήκει στην οικογένεια Virtex UltraScale+ και η περίοδος του ρολογιού έχει οριστεί στα 10 νανοδευτερόλεπτα. Συνολικά, αυτή η διπλωματική εργασία καταδεικνύει τις δυνατότητες του HLS για τη βελτιστοποίηση των νευρωνικών δικτύων για την υλοποίηση υλικού και παρέχει πληροφορίες για το σχεδιασμό και βελτιστοποίηση κυκλωμάτων υλικού για εφαρμογές μηχανικής μάθησης. 2023-07-03T08:38:04Z 2023-07-03T08:38:04Z 2023-07-03 https://hdl.handle.net/10889/25299 en Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf |