Αλγόριθμοι βαθειάς μηχανικής μάθησης και υλοποιήσεις σε επαναδιατασσόμενες διατάξεις για εφαρμογές επεξεργασίας εικόνας

Η Μηχανική Μάθηση έχει σημειώσει σημαντική εξέλιξη τα τελευταία χρόνια. Η αναγνώριση εικόνας καθίσταται σημαντικό στοιχείο σε όλο και περισσότερες εφαρμογές, από ιατρικές διαγνώσεις και αυτόνομα αυτοκίνητα μέχρι και σε μεγάλα κέντρα δεδομένων. Πολλές εφαρμογές νευρωνικών δικτύων αντιπροσωπεύουν μια...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κανακάρης, Νικόλαος
Άλλοι συγγραφείς: Kanakaris, Nikolaos
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14041
Περιγραφή
Περίληψη:Η Μηχανική Μάθηση έχει σημειώσει σημαντική εξέλιξη τα τελευταία χρόνια. Η αναγνώριση εικόνας καθίσταται σημαντικό στοιχείο σε όλο και περισσότερες εφαρμογές, από ιατρικές διαγνώσεις και αυτόνομα αυτοκίνητα μέχρι και σε μεγάλα κέντρα δεδομένων. Πολλές εφαρμογές νευρωνικών δικτύων αντιπροσωπεύουν μια υπολογιστική πρόκληση για τους επεξεργαστές γε- νικής χρήσης. Απαιτούν λύσεις υψηλής απόδοσης που ενσωματώνονται σε υπάρχοντα συστή- ματα με αυστηρούς περιορισμούς πραγματικού χρόνου και ισχύος . Αυτή η διπλωματική εργασία διερευνά τις δυνατότητες της επιτάχυνσης των συνελικτικών νευρωνικών δικτύων με βάση το FPGA. Το ετερογενές σύστημα CPU-FPGA έχει σχεδιαστεί για την επιτάχυνση της αναγνώρισης εικόνας χρησιμοποιώντας τον επιταχυντή υλικού, επιτυγχάνοντας σημαντικά αποτελέσματα. Ο επιταχυντής FPGA βασίζεται στην συνάρτηση της δισδιάστατης συνέλιξης η οποία είναι το πιο υπολογιστικά συμφορητικό μέρος των αλγορίθμων αναγνώρισης εικόνας στα συνελικτικά νευρω- νικά δίκτυα. Αυτός ο αλγόριθμος πολλαπλασιασμού με πολλαπλούς ενσωματωμένους βρόχους επανάληψης υλοποιείται με μια συστολική μήτρα που διατρέχει την εικόνα υιοθετεί διάφορες τεχνικές βελτιστοποίησης για να ελαχιστοποιήσει τις προσβάσεις στη μνήμη και να παραλληλο- ποιήσει πλήρως τις αριθμητικές πράξεις. Ο επιταχυντής FPGA έχει υλοποιηθεί με High-Level Synthesis στο περιβάλλον ανάπτυξης Vitis HLS για τη πλακέτα Xilinx Zynq ZCU-704 και φτάνει τη συχνότητα ρολογιού 200MHz με μικρή χρήση πόρων. Τα αποτελέσματα δείχνουν ένα αποδοτικό όσο αναφορά την διαπερατότητα για τους πόρους που χρησιμοποιήθηκαν σύστημα.