Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι

Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, M...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Συμεωνίδης, Παναγιώτης, Symeonidis, Panagiotis
Μορφή: 7
Γλώσσα:Greek
Έκδοση: 2023
Διαθέσιμο Online:http://repository.kallipos.gr/handle/11419/9579
id kallipos-11419-9579
record_format dspace
spelling kallipos-11419-95792023-05-31T12:22:46Z Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι Deep Reinforcement Learning and Genetic Algorithms Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.). In chapter seven we will present reinforcement learning algorithms (reinforcement learning) -because it reinforces desired behaviours by rewarding them- where the system recommendation system tries to learn through its interaction with the user. Furthermore, we will analyse recommendation algorithms (Markov Chains, Markov Decision Processes etc.) based on data that evolve over time, i.e. that have a sequence and are in serial order. We will also study Advantage Actor-Critic learning algorithms (A2C) and Deep Q-learning Network (DQN), which are reinforcement learning algorithms that combine its methods with multi-level neural networks. Finally, we will describe the recommendation systems based on genetic algorithms, which simulate the natural phenomenon of evolution and natural selection: the search for the appropriate neighbourhood of the user under consideration is thus initiated by a number of random neighbouring users on the basis of a set of initial assumptions. On this initial population, and if its members are evaluated by means of a fitness function, the new generation of neighbours is generated by reproduction procedures (e.g. crossover, mutation etc.). 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 7 http://repository.kallipos.gr/handle/11419/9579 el 1 application/pdf
institution Kallipos
collection DSpace
language Greek
description Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.).
format 7
author Συμεωνίδης, Παναγιώτης
Symeonidis, Panagiotis
spellingShingle Συμεωνίδης, Παναγιώτης
Symeonidis, Panagiotis
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
author_facet Συμεωνίδης, Παναγιώτης
Symeonidis, Panagiotis
author_sort Συμεωνίδης, Παναγιώτης
title Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_short Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_full Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_fullStr Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_full_unstemmed Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_sort βαθιά ενισχυτική μάθηση και γενετικοί αλγόριθμοι
publishDate 2023
url http://repository.kallipos.gr/handle/11419/9579
work_keys_str_mv AT symeōnidēspanagiōtēs bathiaenischytikēmathēsēkaigenetikoialgorithmoi
AT symeonidispanagiotis bathiaenischytikēmathēsēkaigenetikoialgorithmoi
AT symeōnidēspanagiōtēs deepreinforcementlearningandgeneticalgorithms
AT symeonidispanagiotis deepreinforcementlearningandgeneticalgorithms
_version_ 1771301315227418624