High level synthesis architectures of neural network to accelerate handwritten digit recognition

Neural networks have achieved impressive results in a wide range of applications. However, designing and optimizing neural networksfor hardware implementation can be a challenging task due to the complex computations involved. High level synthesis (HLS) is a promising approach that allows hardwar...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παπαδόπουλος, Παναγιώτης Βασίλειος
Άλλοι συγγραφείς: Papadopoylos, Panagiotis Vasileios
Γλώσσα:English
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25299
id nemertes-10889-25299
record_format dspace
institution UPatras
collection Nemertes
language English
topic High level synthesis
Handwritten digit recognition acceleration
Συνθεση υψηλού επιπέδου
Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων
spellingShingle High level synthesis
Handwritten digit recognition acceleration
Συνθεση υψηλού επιπέδου
Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων
Παπαδόπουλος, Παναγιώτης Βασίλειος
High level synthesis architectures of neural network to accelerate handwritten digit recognition
description Neural networks have achieved impressive results in a wide range of applications. However, designing and optimizing neural networksfor hardware implementation can be a challenging task due to the complex computations involved. High level synthesis (HLS) is a promising approach that allows hardware designers to write high-level descriptions of hardware circuits and automatically generate optimized low-level hardware implementations. In this diploma thesis, we investigate the use of HLS, with Vivado HLS framework, to optimize a fully connected neural network for digit recognition. HLS is a design process that takes as input an algorithmic description of a certain function, and outputs a digital hardware implementation of the function. Specifically, we explore the use of HLS tools to automatically generate hardware circuits that implement the neural network, and to optimize the circuit for performance and area. We also investigate the impact of various design choices, such as the number of layers and neurons and techniques who affect the RTL implementation, on the performance of the optimized circuit. There are four different architectures proposed including the Baseline. Furthermore, through an exploration of different parameters of the model we arrive at some interesting conclusions. To evaluate the effectiveness of our approach, we compare the performance and the FPGA’s utilization resources of the optimized circuit with that of a software-based implementation of the neural network. Our results show that the HLS-generated hardware circuit achieves significantly higher performance and lower power consumption compared to the software-based implementation. All implementations use the part xcvu35p-fsvh2892-1-e which belongs to the Virtex UltraScale+ family and the period of the clock is set at 10 nanoseconds. Overall, this diploma thesis demonstrates the potential of HLS for optimizing neural networks for hardware implementation and provides insights into the design and optimization of hardware circuits for machine learning applications.
author2 Papadopoylos, Panagiotis Vasileios
author_facet Papadopoylos, Panagiotis Vasileios
Παπαδόπουλος, Παναγιώτης Βασίλειος
author Παπαδόπουλος, Παναγιώτης Βασίλειος
author_sort Παπαδόπουλος, Παναγιώτης Βασίλειος
title High level synthesis architectures of neural network to accelerate handwritten digit recognition
title_short High level synthesis architectures of neural network to accelerate handwritten digit recognition
title_full High level synthesis architectures of neural network to accelerate handwritten digit recognition
title_fullStr High level synthesis architectures of neural network to accelerate handwritten digit recognition
title_full_unstemmed High level synthesis architectures of neural network to accelerate handwritten digit recognition
title_sort high level synthesis architectures of neural network to accelerate handwritten digit recognition
publishDate 2023
url https://hdl.handle.net/10889/25299
work_keys_str_mv AT papadopoulospanagiōtēsbasileios highlevelsynthesisarchitecturesofneuralnetworktoacceleratehandwrittendigitrecognition
AT papadopoulospanagiōtēsbasileios architektonikessynthesēsypsēlouepipedouneurōnikoudiktyougiatēnepitachynsēanagnōrisēspsēphiōn
_version_ 1771297200386605056
spelling nemertes-10889-252992023-07-04T03:55:16Z High level synthesis architectures of neural network to accelerate handwritten digit recognition Αρχιτεκτονικές σύνθεσης υψηλού επιπέδου νευρωνικού δικτύου για την επιτάχυνση αναγνώρισης ψηφίων Παπαδόπουλος, Παναγιώτης Βασίλειος Papadopoylos, Panagiotis Vasileios High level synthesis Handwritten digit recognition acceleration Συνθεση υψηλού επιπέδου Επιτάχυνση αναγνώρισης χειρόγραφων ψηφίων Neural networks have achieved impressive results in a wide range of applications. However, designing and optimizing neural networksfor hardware implementation can be a challenging task due to the complex computations involved. High level synthesis (HLS) is a promising approach that allows hardware designers to write high-level descriptions of hardware circuits and automatically generate optimized low-level hardware implementations. In this diploma thesis, we investigate the use of HLS, with Vivado HLS framework, to optimize a fully connected neural network for digit recognition. HLS is a design process that takes as input an algorithmic description of a certain function, and outputs a digital hardware implementation of the function. Specifically, we explore the use of HLS tools to automatically generate hardware circuits that implement the neural network, and to optimize the circuit for performance and area. We also investigate the impact of various design choices, such as the number of layers and neurons and techniques who affect the RTL implementation, on the performance of the optimized circuit. There are four different architectures proposed including the Baseline. Furthermore, through an exploration of different parameters of the model we arrive at some interesting conclusions. To evaluate the effectiveness of our approach, we compare the performance and the FPGA’s utilization resources of the optimized circuit with that of a software-based implementation of the neural network. Our results show that the HLS-generated hardware circuit achieves significantly higher performance and lower power consumption compared to the software-based implementation. All implementations use the part xcvu35p-fsvh2892-1-e which belongs to the Virtex UltraScale+ family and the period of the clock is set at 10 nanoseconds. Overall, this diploma thesis demonstrates the potential of HLS for optimizing neural networks for hardware implementation and provides insights into the design and optimization of hardware circuits for machine learning applications. Τα νευρωνικά δίκτυα έχουν επιτύχει εντυπωσιακά αποτελέσματα σε ένα ευρύ φάσμα εφαρμογών. Ωστόσο, ο σχεδιασμός και η βελτιστοποίηση νευρωνικών δικτύων για εφαρμογή υλικού μπορεί είναι ένα δύσκολο έργο λόγω των περίπλοκων υπολογισμών που εμπλέκονται. Υψηλού επιπέδου σύνθεση (HLS) είναι μια πολλά υποσχόμενη προσέγγιση που επιτρέπει στους σχεδιαστές υλικού να γράφουν υψηλού επιπέδου περιγραφές κυκλωμάτων υλικού και να δημιουργούν αυτόματα βελτιστοποιημένο χαμηλού επιπέδου υλοποιήσεις υλικού. Σε αυτή τη διπλωματική εργασία, διερευνούμε τη χρήση του HLS, με το Vivado HLS framework, με στόχο την βελτιστοποίηση ενός πλήρως συνδεδεμένου νευρωνικού δικτύου για αναγνώριση ψηφίων. Το HLS είναι μια διαδικασία σχεδιασμού που λαμβάνει ως είσοδο μια αλγοριθμική περιγραφή μιας συγκεκριμένης συνάρτησης και βγάζει a ψηφιακό υλικό υλοποίηση της λειτουργίας. Συγκεκριμένα, διερευνούμε τη χρήση του HLS για την αυτόματη δημιουργία κυκλωμάτων υλικού που υλοποιούν το νευρικό δικτύου και για τη βελτιστοποίηση του κυκλώματος για απόδοση και περιοχή. Ερευνούμε επίσης τον αντίκτυπο των διαφόρων επιλογών σχεδιασμού, όπως ο αριθμός των στρωμάτων και των νευρώνων και τεχνικές που επηρεάζουν την υλοποίηση RTL, σχετικά με την απόδοση του βελτιστοποιημένου κυκλώματος. Υπάρχουν τέσσερις διαφορετικές αρχιτεκτονικές που προτείνονται, συμπεριλαμβανομένης της αρχιτεκτονικής αναφοράς. Επιπλέον, μέσα από μια διερεύνηση διαφορετικών παραμέτρων του μοντέλου φτάνουμε σε μερικά ενδιαφέροντα συμπεράσματα. Για να αξιολογήσουμε την αποτελεσματικότητα της προσέγγισής μας, συγκρίνουμε την απόδοση και την χρήση πόρων του FPGA του βελτιστοποιημένου κυκλώματος με εκείνου που ειναι βασισμένο σε λογισμικό. Τα αποτελέσματά μας δείχνουν ότι το κύκλωμα υλικού που δημιουργείται επιτυγχάνει σημαντικά υψηλότερη απόδοση και χαμηλότερη ισχύ κατανάλωσης σε σύγκριση με την εφαρμογή που βασίζεται σε λογισμικό. Όλες οι υλοποιήσεις χρησιμοποιούν την συσκευή xcvu35p-fsvh2892-1-e που ανήκει στην οικογένεια Virtex UltraScale+ και η περίοδος του ρολογιού έχει οριστεί στα 10 νανοδευτερόλεπτα. Συνολικά, αυτή η διπλωματική εργασία καταδεικνύει τις δυνατότητες του HLS για τη βελτιστοποίηση των νευρωνικών δικτύων για την υλοποίηση υλικού και παρέχει πληροφορίες για το σχεδιασμό και βελτιστοποίηση κυκλωμάτων υλικού για εφαρμογές μηχανικής μάθησης. 2023-07-03T08:38:04Z 2023-07-03T08:38:04Z 2023-07-03 https://hdl.handle.net/10889/25299 en Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf