Ανάπτυξη αλγορίθμων ενισχυτικής μάθησης σε C++

Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτ...

Full description

Bibliographic Details
Main Author: Κωνσταντίνου, Παύλος
Other Authors: Konstantinou, Pavlos
Language:Greek
Published: 2022
Subjects:
Online Access:https://hdl.handle.net/10889/23672
Description
Summary:Η ενισχυτική μάθηση είναι ένα μαθηματικό framework που επιτρέπει σε ευφυείς πράκτορες να μαθαίνουν από τα λάθη τους και να βελτιώνονται όσο αλληλεπιδρούν περισσότερο με το περιβάλλον. Υπάρχουν διαθέσιμες πολλές υλοποιήσεις των πιο δημοφιλών αλγορίθμων ενισχυτικής μάθησης κυρίως σε python. Στόχος αυτής της διπλωματικής εργασίας είναι να δημιουργήσουμε μία βιβλιοθήκη με ελεγμένες υλοποιήσεις από διάφορους αλγορίθμους ενισχυτικής μάθησης στη γλώσσα C++ και με χρήση της βιβλιοθήκης libtorch. Πιο συγκεκριμένα θα δημιουργήσουμε ένα περιβάλλον με εκρεμμές με την βοήθεια της βιβλιοθήκης robot_dart και θα επιχειρήσουμε να λύσουμε αυτό το πρόβλημα με αλγόριθμους ενισχυτικής μάθησης.