Ανάπτυξη αλγορίθμων ενισχυτικής μάθησης σε C++

Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κωνσταντίνου, Παύλος
Άλλοι συγγραφείς: Konstantinou, Pavlos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23672
Περιγραφή
Περίληψη:Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτής της διπλωματικής εργασίας είναι να δημιουργήσουμε μία βιβλιοθήκη με ελεγμένες υλοποιήσεις από διάφορους αλγορίθμους ενισχυτικής μάθησης στη γλώσσα C++ και με χρήση της βιβλιοθήκης libtorch. Πιο συγκεκριμένα θα δημιουργήσουμε ένα περιβάλλον με εκρεμμές με την βοήθεια της βιβλιοθήκης robot_dart και θα επιχειρήσουμε να λύσουμε αυτό το πρόβλημα με αλγόριθμους ενισχυτικής μάθησης.