Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, M...
Κύριοι συγγραφείς: | , |
---|---|
Μορφή: | 7 |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Διαθέσιμο Online: | http://repository.kallipos.gr/handle/11419/9579 |
id |
kallipos-11419-9579 |
---|---|
record_format |
dspace |
spelling |
kallipos-11419-95792023-05-31T12:22:46Z Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι Deep Reinforcement Learning and Genetic Algorithms Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.). In chapter seven we will present reinforcement learning algorithms (reinforcement learning) -because it reinforces desired behaviours by rewarding them- where the system recommendation system tries to learn through its interaction with the user. Furthermore, we will analyse recommendation algorithms (Markov Chains, Markov Decision Processes etc.) based on data that evolve over time, i.e. that have a sequence and are in serial order. We will also study Advantage Actor-Critic learning algorithms (A2C) and Deep Q-learning Network (DQN), which are reinforcement learning algorithms that combine its methods with multi-level neural networks. Finally, we will describe the recommendation systems based on genetic algorithms, which simulate the natural phenomenon of evolution and natural selection: the search for the appropriate neighbourhood of the user under consideration is thus initiated by a number of random neighbouring users on the basis of a set of initial assumptions. On this initial population, and if its members are evaluated by means of a fitness function, the new generation of neighbours is generated by reproduction procedures (e.g. crossover, mutation etc.). 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 7 http://repository.kallipos.gr/handle/11419/9579 el 1 application/pdf |
institution |
Kallipos |
collection |
DSpace |
language |
Greek |
description |
Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.). |
format |
7 |
author |
Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis |
spellingShingle |
Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
author_facet |
Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis |
author_sort |
Συμεωνίδης, Παναγιώτης |
title |
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
title_short |
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
title_full |
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
title_fullStr |
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
title_full_unstemmed |
Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι |
title_sort |
βαθιά ενισχυτική μάθηση και γενετικοί αλγόριθμοι |
publishDate |
2023 |
url |
http://repository.kallipos.gr/handle/11419/9579 |
work_keys_str_mv |
AT symeōnidēspanagiōtēs bathiaenischytikēmathēsēkaigenetikoialgorithmoi AT symeonidispanagiotis bathiaenischytikēmathēsēkaigenetikoialgorithmoi AT symeōnidēspanagiōtēs deepreinforcementlearningandgeneticalgorithms AT symeonidispanagiotis deepreinforcementlearningandgeneticalgorithms |
_version_ |
1771301315227418624 |