Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι

Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, M...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς:	Συμεωνίδης, Παναγιώτης, Symeonidis, Panagiotis
Μορφή:	7
Γλώσσα:	Greek
Έκδοση:	2023
Διαθέσιμο Online:	http://repository.kallipos.gr/handle/11419/9579

id	kallipos-11419-9579
record_format	dspace
spelling	kallipos-11419-95792023-05-31T12:22:46Z Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι Deep Reinforcement Learning and Genetic Algorithms Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.). In chapter seven we will present reinforcement learning algorithms (reinforcement learning) -because it reinforces desired behaviours by rewarding them- where the system recommendation system tries to learn through its interaction with the user. Furthermore, we will analyse recommendation algorithms (Markov Chains, Markov Decision Processes etc.) based on data that evolve over time, i.e. that have a sequence and are in serial order. We will also study Advantage Actor-Critic learning algorithms (A2C) and Deep Q-learning Network (DQN), which are reinforcement learning algorithms that combine its methods with multi-level neural networks. Finally, we will describe the recommendation systems based on genetic algorithms, which simulate the natural phenomenon of evolution and natural selection: the search for the appropriate neighbourhood of the user under consideration is thus initiated by a number of random neighbouring users on the basis of a set of initial assumptions. On this initial population, and if its members are evaluated by means of a fitness function, the new generation of neighbours is generated by reproduction procedures (e.g. crossover, mutation etc.). 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 2023-05-29T07:32:55Z 2023-05-29T10:03:11Z 7 http://repository.kallipos.gr/handle/11419/9579 el 1 application/pdf
institution	Kallipos
collection	DSpace
language	Greek
description	Στο έβδομο κεφάλαιο θα παρουσιάσουμε αλγορίθμους ενισχυτικής μάθησης (reinforcement learning) -διότι ενισχύει επιθυμητές συμπεριφορές επιβραβεύοντάς τις-, όπου το σύστημα συστάσεων προσπαθεί να μάθει μέσα από τη διάδρασή του με τον χρήστη. Ακόμη, θα αναλύσουμε αλγορίθμους συστάσεων (Markov Chains, Markov Decision Processes κ.λπ.) που βασίζονται σε δεδομένα χρονικώς εξελισσόμενα, τα οποία δηλαδή έχουν μια αλληλουχία και βρίσκονται σε σειριακή διάταξη. Επίσης, θα μελετήσουμε τους αλγορίθμους Advantage Actor-Critic learning (A2C) και Deep Q-learning Network (DQN), οι οποίοι είναι αλγόριθμοι ενισχυτικής μάθησης που συνδυάζουν μεθόδους της με νευρωνικά δίκτυα πολλών επιπέδων. Τέλος, θα περιγράψουμε τα συστήματα συστάσεων που βασίζονται σε γενετικούς αλγορίθμους (genetic algorithms), οι οποίοι προσομοιώνουν το φυσικό φαινόμενο της εξέλιξης και της φυσικής επιλογής: η αναζήτηση, λοιπόν, της κατάλληλης γειτονιάς του υπό εξέταση χρήστη ξεκινάει με έναν αριθμό τυχαίων γειτονικών χρηστών βάσει ενός συνόλου αρχικών παραδοχών. Επί αυτού του αρχικού πληθυσμού, και εφόσον τα μέλη του αξιολογηθούν με τη βοήθεια μιας συνάρτησης καταλληλότητας (fitness function), παράγεται η νέα γενιά γειτόνων μέσω διαδικασιών αναπαραγωγής (π.χ. διασταύρωσης, μετάλλαξης κ.λπ.).
format	7
author	Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis
spellingShingle	Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
author_facet	Συμεωνίδης, Παναγιώτης Symeonidis, Panagiotis
author_sort	Συμεωνίδης, Παναγιώτης
title	Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_short	Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_full	Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_fullStr	Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_full_unstemmed	Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι
title_sort	βαθιά ενισχυτική μάθηση και γενετικοί αλγόριθμοι
publishDate	2023
url	http://repository.kallipos.gr/handle/11419/9579
work_keys_str_mv	AT symeōnidēspanagiōtēs bathiaenischytikēmathēsēkaigenetikoialgorithmoi AT symeonidispanagiotis bathiaenischytikēmathēsēkaigenetikoialgorithmoi AT symeōnidēspanagiōtēs deepreinforcementlearningandgeneticalgorithms AT symeonidispanagiotis deepreinforcementlearningandgeneticalgorithms
_version_	1771301315227418624

Βαθιά Ενισχυτική Μάθηση και Γενετικοί Αλγόριθμοι

Παρόμοια τεκμήρια