Αρχιτεκτονικές υλικού για επιτάχυνση υπολογισμών σε convolutions neural networks

Με την αυξανόμενη διαθεσιμότητα σε υπολογιστικούς πόρους, ηδημοσιότητα της μηχανικής μάθησης αυξάνεται ραγδαία όσον αφορά τηνανάλυση και επεξεργασία δεδομένων, παρέχοντας λύσεις σε ζητήματαδιαφόρων επιστημονικών πεδίων. Τα νευρωνικά δίκτυα αποτελούν έναναπό τους πιο μελετημένους και χρησιμοποιούμενο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σκιαδέλλης, Αργύρης
Άλλοι συγγραφείς: Skiadellis, Argiris
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14667
Περιγραφή
Περίληψη:Με την αυξανόμενη διαθεσιμότητα σε υπολογιστικούς πόρους, ηδημοσιότητα της μηχανικής μάθησης αυξάνεται ραγδαία όσον αφορά τηνανάλυση και επεξεργασία δεδομένων, παρέχοντας λύσεις σε ζητήματαδιαφόρων επιστημονικών πεδίων. Τα νευρωνικά δίκτυα αποτελούν έναναπό τους πιο μελετημένους και χρησιμοποιούμενους υπο-τομείς τηςμηχανικής μάθησης, συνεισφέροντας αποτελεσματικές μεθόδουςκατηγοριοποίησης δεδομένων. Η αναγνώριση εικόνας καθίσταταισημαντικό στοιχείο σε όλο και περισσότερες εφαρμογές όπως είναι ηρομποτική και οι ιατρικές διαγνώσεις. Επομένως, υπάρχει αυξανόμενηανάγκη για χωρικά και ενεργειακά αποδοτικές λύσεις, οι οποίεςικανοποιούν τις προδιαγραφές των εφαρμογών αυτών, διατηρώντας,ωστόσο, υψηλές επιδόσεις. Ως εκ τούτου, απαιτούν λύσεις υψηλήςαπόδοσης που ενσωματώνονται σε υπάρχοντα συστήματα με αυστηρούςπεριορισμούς πραγματικού χρόνου και ισχύος. Ακολουθώντας αυτή τηνπορεία, η παρούσα διπλωματική εργασία διερευνά τις δυνατότητες τηςεπιτάχυνσης των συνελικτικών νευρωνικών δικτύων με βάση το FPGA. Τονευρωνικο δικτυο που αποφασίστηκε να υλοποιηθεί ειναι το VGG-16 καιέχει την δυνατότητα κατηγοροποίησης εικόνων. Το ετερογενές σύστημαCPU-FPGA έχει σχεδιαστεί για την επιτάχυνση της αναγνώρισης εικόναςχρησιμοποιώντας τον επιταχυντή υλικού, επιτυγχάνοντας καλέςαποδόσεις. Ο επιταχυντής FPGA εστιάζει στην συνάρτηση συνέλιξης ηοποία είναι το πιο υπολογιστικά συμφορητικό μέρος των αλγορίθμωναναγνώρισης εικόνας στα συνελικτικά νευρωνικά δίκτυα. Μίαλεπτομερής ανάλυση της δομής του δικτύου, αποκαλύπτει λύσειςδιαφορετικών λειτουργικών χαρακτηριστικών, με στόχο διάφορεςτεχνικές βελτιστοποίησης για να ελαχιστοποιήσει τις προσβάσεις στημνήμη και να παραλληλοποιήσει πλήρως τις αριθμητικές πράξεις. Οεπιταχυντής FPGA έχει υλοποιηθεί με High-Level Synthesis στοπεριβάλλον ανάπτυξης Vivado HLS για τη πλακέτα Xilinx Virtex VC-707και φτάνει τη συχνότητα ρολογιού 200MHz.