Περίληψη: | Οι τελευταίες τεχνολογικές εξελίξεις στον χώρο της τεχνητής νοημοσύνης έχουν έρθει από την χρήση νευρωνικών δικτύων. Αυτά έχουν δώσει εξαιρετικά αποτελέσματα σε διάφορες εφαρμογές όπως η επεξεργασία φυσικής γλώσσας και ομιλίας, η υπολογιστική όραση πράγμα που τα έχει κάνει να χρησιμοποιούνται ως τμήματα σε πολλών συστημάτων ελέγχου και πρόβλεψης. Οι βελτιώσεις που παρατηρούνται στον κλάδο αυτό οφείλονται κυρίως στην επίτευξη αποδοτικής εκπαίδευσης μοντέλων με πολύ μεγάλο αριθμό παραμέτρων σε έναν τεράστιο όγκο δεδομένων. Συγκεκριμένα τα συνελικτικά νευρωνικά δίκτυα (CNN) είναι μια σύγχρονη μορφή νευρωνικών δικτύων που είναι ικανά να μαθαίνουν χαρακτηριστικά σε χωρικά συσχετισμένα δεδομένα όπως οι εικόνες, ο ήχος και ο γραπτός λόγος. Η βασική μαθηματική πράξη πάνω στην οποία βασίζονται είναι αυτή της συνέλιξης, που τους επιτρέπει να ανιχνεύουν στα δεδομένα ένα χαρακτηριστικό που έχουν μάθει μέσω των παραμέτρων τους. Μεγάλες αρχιτεκτονικές τέτοιων δικτύων έχουν υπερνικήσει τα αντίστοιχα παραδοσιακά νευρωνικά δίκτυα πετυχαίνοντας μάλιστα επιδώσεις καλύτερες από αυτές του ανθρώπου σε δύσκολα προβλήματα όπως η αναγνώριση αντικειμένων.
Παρά τις βελτιωμένες επιδόσεις των δικτύων αυτών σε πληθώρα προβλημάτων το αυξημένο μέγεθός τους καθιστά την χρήση τους πολύ αργή για εφαρμογές πραγματικού χρόνου. Η ζήτηση αυτή για ενσωμάτωση σε εφαρμογές πραγματικού χρόνου δημιουργεί ανάγκες για επιτάχυνση των αλγορίθμων αυτών. Για τον σκοπό αυτό γίνεται αξιοποίηση υλικού γενικού σκοπού όπως οι κάρτες γραφικών (GPUs) και ειδικού σκοπού με παράλληλες αρχιτεκτονικές μεγάλης κλίμακας ώστε να επιταχύνεται τόσο η χρήση των νευρωνικών δικτύων (inference) όσο και η διαδικασία της εκπαίδευσής τους (training). Στην παρούσα εργασία επιλέχθηκε ένα σύγχρονο νευρωνικό δίκτυο, εκπαιδευμένο σε ένα σύνθετο πρόβλημα, αυτό της αναγνώρισης θέσης μελών του ανθρώπινου σώματος σε εικόνες και επιταχύνθηκε χρησιμοποιώντας υπολογιστικές μονάδες γενικού σκοπού (CPUs, DPUs) και ειδικού σκοπού (DPUs).
|