Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι

Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, M...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Συμεωνίδης, Παναγιώτης, Symeonidis, Panagiotis
Μορφή: 7
Γλώσσα:Greek
Έκδοση: 2023
Διαθέσιμο Online:http://repository.kallipos.gr/handle/11419/9579
Περιγραφή
Περίληψη:Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.).