Ανάπτυξη αλγορίθμων ενισχυτικής μάθησης σε C++
Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/23672 |
Περίληψη: | Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτής της διπλωματικής εργασίας είναι να δημιουργήσουμε μία βιβλιοθήκη με ελεγμένες υλοποιήσεις από διάφορους αλγορίθμους ενισχυτικής μάθησης στη
γλώσσα C++ και με χρήση της βιβλιοθήκης libtorch. Πιο συγκεκριμένα θα δημιουργήσουμε ένα περιβάλλον με εκρεμμές με την βοήθεια της βιβλιοθήκης robot_dart και θα επιχειρήσουμε να λύσουμε αυτό το πρόβλημα με αλγόριθμους ενισχυτικής μάθησης. |
---|