Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα

Στην συγκεκριμένη διπλωματική εργασία ασχοληθήκαμε με την περίπτωση των Multi – Armed Bandit Προβλημάτων, παρουσιάσαμε τις βασικές τους έννοιες, το μοντέλο τους και έναν βασικό αλγόριθμο που προσπαθεί να δώσει λύσεις προς αυτή την κατεύθυνση, τον Exp3. Ειδικεύσαμε στην περίπτωση του αγοραστή – πωλη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κοτρώτσου, Παναγιώτα
Άλλοι συγγραφείς: Kotrotsou, Panagiota
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14112
id nemertes-10889-14112
record_format dspace
spelling nemertes-10889-141122022-09-05T13:59:46Z Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα Study of immediate response learning algorithms in strategic enviroments Κοτρώτσου, Παναγιώτα Kotrotsou, Panagiota Αλγόριθμοι σε στρατηγικά περιβάλλοντα Υπομονετικοί αγοραστές Multi-armed bandit problem Στην συγκεκριμένη διπλωματική εργασία ασχοληθήκαμε με την περίπτωση των Multi – Armed Bandit Προβλημάτων, παρουσιάσαμε τις βασικές τους έννοιες, το μοντέλο τους και έναν βασικό αλγόριθμο που προσπαθεί να δώσει λύσεις προς αυτή την κατεύθυνση, τον Exp3. Ειδικεύσαμε στην περίπτωση του αγοραστή – πωλητών και πέρα από την κλασική περίπτωση, μελετήσαμε την περίπτωση των υπομονετικών αγοραστών. Εστιάσαμε σε έναν Online Αλγόριθμο δημοσίευσης τιμών και σε έναν δεύτερο Αλγόριθμο που τον εκτελεί και δημιουργεί τις εισόδους, παρουσιάζοντας το θεωρητικό τους υπόβαθρο και την μετρική αξιολόγησής τους (Regret). Οι αλγόριθμοι αυτοί υλοποιήθηκαν σε περιβάλλον Matlab και αξιολογήθηκε η συμπεριφορά τους, όσον αφορά το Regret και λαμβάνοντας υπόψη παραμέτρους, όπως ο χρονικός ορίζοντας, η χρησιμοποιούμενη κατανομή και η τιμή της μέγιστης υπομονής. 2020-10-21T15:14:24Z 2020-10-21T15:14:24Z 2020-07-14 http://hdl.handle.net/10889/14112 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Αλγόριθμοι σε στρατηγικά περιβάλλοντα
Υπομονετικοί αγοραστές
Multi-armed bandit problem
spellingShingle Αλγόριθμοι σε στρατηγικά περιβάλλοντα
Υπομονετικοί αγοραστές
Multi-armed bandit problem
Κοτρώτσου, Παναγιώτα
Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
description Στην συγκεκριμένη διπλωματική εργασία ασχοληθήκαμε με την περίπτωση των Multi – Armed Bandit Προβλημάτων, παρουσιάσαμε τις βασικές τους έννοιες, το μοντέλο τους και έναν βασικό αλγόριθμο που προσπαθεί να δώσει λύσεις προς αυτή την κατεύθυνση, τον Exp3. Ειδικεύσαμε στην περίπτωση του αγοραστή – πωλητών και πέρα από την κλασική περίπτωση, μελετήσαμε την περίπτωση των υπομονετικών αγοραστών. Εστιάσαμε σε έναν Online Αλγόριθμο δημοσίευσης τιμών και σε έναν δεύτερο Αλγόριθμο που τον εκτελεί και δημιουργεί τις εισόδους, παρουσιάζοντας το θεωρητικό τους υπόβαθρο και την μετρική αξιολόγησής τους (Regret). Οι αλγόριθμοι αυτοί υλοποιήθηκαν σε περιβάλλον Matlab και αξιολογήθηκε η συμπεριφορά τους, όσον αφορά το Regret και λαμβάνοντας υπόψη παραμέτρους, όπως ο χρονικός ορίζοντας, η χρησιμοποιούμενη κατανομή και η τιμή της μέγιστης υπομονής.
author2 Kotrotsou, Panagiota
author_facet Kotrotsou, Panagiota
Κοτρώτσου, Παναγιώτα
author Κοτρώτσου, Παναγιώτα
author_sort Κοτρώτσου, Παναγιώτα
title Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
title_short Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
title_full Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
title_fullStr Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
title_full_unstemmed Μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
title_sort μελέτη αλγορίθμων άμεσης απόκρισης σε στρατηγικά περιβάλλοντα
publishDate 2020
url http://hdl.handle.net/10889/14112
work_keys_str_mv AT kotrōtsoupanagiōta meletēalgorithmōnamesēsapokrisēssestratēgikaperiballonta
AT kotrōtsoupanagiōta studyofimmediateresponselearningalgorithmsinstrategicenviroments
_version_ 1771297220770922496