Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
Στην συγκεκριμένη διπλωματική εργασία ασχοληθήκαμε με την περίπτωση των Multi – Armed Bandit Προβλημάτων, παρουσιάσαμε τις βασικές τους έννοιες, το μοντέλο τους και έναν βασικό αλγόριθμο που προσπαθεί να δώσει λύσεις προς αυτή την κατεύθυνση, τον Exp3. Ειδικεύσαμε στην περίπτωση του αγοραστή – πωλη...
Κύριος συγγραφέας: | Κοτρώτσου, Παναγιώτα |
---|---|
Άλλοι συγγραφείς: | Kotrotsou, Panagiota |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14112 |
Παρόμοια τεκμήρια
-
Reinforcement learning for task offloading in next generation networks : algorithms and hardware acceleration
ανά: Γερογιάννης, Γεράσιμος
Έκδοση: (2021) -
Σύγκριση μιας συνεργατικής μαθησιακής δραστηριότητας σε πραγματικό και εικονικό 3D περιβάλλον
ανά: Βρέλλης, Ιωάννης
Έκδοση: (2013) -
Ιζηματολογία - Περιβάλλοντα Ιζηματογένεσης
ανά: Ντρίνια, Χαρά, κ.ά.
Έκδοση: (2023) -
Ζητήματα υπολογισμού ισορροπιών σε παιχνίδια ασφαλείας
ανά: Κουναλάκη, Μαρία
Έκδοση: (2020) -
Τι πρέπει να ξέρουν πωλητές και αγοραστές γιά τα αμοιβαία κεφάλαια : Ελληνική νομοθεσία και σχετική οδηγία της Ε.Ο.Κ.
Έκδοση: (1989)