Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems

In optimal stopping problems, the objective is the acquisition of a time to take a particular action, in order to minimize an expected cost. To properly capture that stopping time, however, one has to compute the value function, this computation is performed numerically and suffers from the curse...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τοπολλάι, Κρίστι
Άλλοι συγγραφείς: Topollai, Kristi
Γλώσσα:English
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/16450
id nemertes-10889-16450
record_format dspace
spelling nemertes-10889-164502022-09-05T14:01:17Z Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems Νευρωνικά δίκτυα για την προσέγγιση της συνάρτησης αξίας σε μαρκοβιανά προβλήματα βέλτιστης στάσης άπειρου ορίζοντα Τοπολλάι, Κρίστι Topollai, Kristi Optimal stopping Neural networks Sequential analysis Stopping times Curse of dimensionality Partial differential equations Value function Supervised learning Πρόβλημα βέλτιστης στάσης Χρόνος στάσης Νευρωνικά δίκτυα Ακολουθιακή ανάλυση Κατάρα της διάστασης Μερικές διαφορικές εξισώσεις Συνάρτηση αξίας Επιβλεπώμενη μάθηση In optimal stopping problems, the objective is the acquisition of a time to take a particular action, in order to minimize an expected cost. To properly capture that stopping time, however, one has to compute the value function, this computation is performed numerically and suffers from the curse of dimensionality. We attempt to overcome the curse of dimensionality by using Neural Networks for the approximation of the value function. We investigate a particular case of the optimal stopping problems, infinite horizon markov optimal stopping problems and we show that Neural Networks can efficiently approximate the Value function even in a high-dimensional setting where the underlying probability densities may be absent. We conclude by providing an application of our method on adaptive filtering in a sequential estimation setting. Στα προβλήματα βέλτιστης στάσης, ο στόχος είναι η εύρεση του χρόνου εκτέλεσης κάποιας ενέργειας με σκοπό την ελαχιστοποίηση κάποιου κόστους. Για να βρεθεί ο χρόνος στάσης όμως, θα πρέπει να υπολογιστεί μια συνάρτηση που καλείται συνάρτηση αξίας, αυτός ο υπολογισμός πραγματοποιείται αριθμητικά και πάσχει από την κατάρα της διάστασης. Επιδιώκουμε να ξεπεράσουμε την κατάρα της διάστασης χρησιμοποιώντας Νευρωνικά Δίκτυα για την προσέγγιση της συνάρτησης αξίας. Θα ερευνήσουμε μια συγκεκριμένη κλάση προβλημάτων βέλτιστης στάσης, τα Μαρκοβιανά προβλήματα βέλτιστης στάσης άπειρου ορίζοντα και θα δείξουμε πως η μέθοδος μας είναι σε θέση να προσεγγίζει αποδοτικά την συνάρτηση αξίας ακόμα και σε πολυδιάστατα προβλήματα όπου οι από κοινού κατανομές είναι άγνωστες. Ολοκληρώνουμε παραθέτοντας μια εφαρμογή της μεθόδου μας στο προσαρμοστικό φιλτράρισμα ύπο το πρίσμα της ακολουθιακής εκτίμησης. 2022-07-11T07:28:49Z 2022-07-11T07:28:49Z 2022-07-05 http://hdl.handle.net/10889/16450 en application/pdf
institution UPatras
collection Nemertes
language English
topic Optimal stopping
Neural networks
Sequential analysis
Stopping times
Curse of dimensionality
Partial differential equations
Value function
Supervised learning
Πρόβλημα βέλτιστης στάσης
Χρόνος στάσης
Νευρωνικά δίκτυα
Ακολουθιακή ανάλυση
Κατάρα της διάστασης
Μερικές διαφορικές εξισώσεις
Συνάρτηση αξίας
Επιβλεπώμενη μάθηση
spellingShingle Optimal stopping
Neural networks
Sequential analysis
Stopping times
Curse of dimensionality
Partial differential equations
Value function
Supervised learning
Πρόβλημα βέλτιστης στάσης
Χρόνος στάσης
Νευρωνικά δίκτυα
Ακολουθιακή ανάλυση
Κατάρα της διάστασης
Μερικές διαφορικές εξισώσεις
Συνάρτηση αξίας
Επιβλεπώμενη μάθηση
Τοπολλάι, Κρίστι
Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
description In optimal stopping problems, the objective is the acquisition of a time to take a particular action, in order to minimize an expected cost. To properly capture that stopping time, however, one has to compute the value function, this computation is performed numerically and suffers from the curse of dimensionality. We attempt to overcome the curse of dimensionality by using Neural Networks for the approximation of the value function. We investigate a particular case of the optimal stopping problems, infinite horizon markov optimal stopping problems and we show that Neural Networks can efficiently approximate the Value function even in a high-dimensional setting where the underlying probability densities may be absent. We conclude by providing an application of our method on adaptive filtering in a sequential estimation setting.
author2 Topollai, Kristi
author_facet Topollai, Kristi
Τοπολλάι, Κρίστι
author Τοπολλάι, Κρίστι
author_sort Τοπολλάι, Κρίστι
title Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
title_short Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
title_full Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
title_fullStr Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
title_full_unstemmed Neural networks for the value function approximation in Markov infinite horizon optimal stopping problems
title_sort neural networks for the value function approximation in markov infinite horizon optimal stopping problems
publishDate 2022
url http://hdl.handle.net/10889/16450
work_keys_str_mv AT topollaikristi neuralnetworksforthevaluefunctionapproximationinmarkovinfinitehorizonoptimalstoppingproblems
AT topollaikristi neurōnikadiktyagiatēnprosengisētēssynartēsēsaxiassemarkobianaproblēmatabeltistēsstasēsapeirouorizonta
_version_ 1771297233762779136