Πρόβλεψη χρονοσειρών με έντονη εποχικότητα
Σε πολλούς επιστημονικούς κλάδους συχνά χρειάζεται να παρακολουθούμε την εξέλιξη ορισμένων φαινομένων στο χρόνο και να κάνουμε προβλέψεις για μελλοντικές τιμές τους στηριζόμενοι σε διαθέσιμες παρατηρήσεις. Μία σειρά από παρατηρήσεις ενός φαινομένου οι οποίες γίνονται σε συγκεκριμένες ισαπέχουσες χρο...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13878 |
id |
nemertes-10889-13878 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Πρόβλεψη xρονοσειρών Τεχνητά νευρωνικά δίκτυα Time series forecasting Artificial neural networks |
spellingShingle |
Πρόβλεψη xρονοσειρών Τεχνητά νευρωνικά δίκτυα Time series forecasting Artificial neural networks Παναγοπούλου, Ευσταθία Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
description |
Σε πολλούς επιστημονικούς κλάδους συχνά χρειάζεται να παρακολουθούμε την εξέλιξη ορισμένων φαινομένων στο χρόνο και να κάνουμε προβλέψεις για μελλοντικές τιμές τους στηριζόμενοι σε διαθέσιμες παρατηρήσεις. Μία σειρά από παρατηρήσεις ενός φαινομένου οι οποίες γίνονται σε συγκεκριμένες ισαπέχουσες χρονικές στιγμές αποτελεί μία χρονοσειρά. Για τη μελέτη των χρονοσειρών μπορούν να χρησιμοποιηθούν διάφορες γραμμικές και μη-γραμμικές μέθοδοι όπως οι παραδοσιακές μέθοδοι πρόβλεψης (μοντέλα ARIMA/SARIMA), τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) και τα Υβριδικά Μοντέλα. Στο πλαίσιο αυτής της διπλωματικής εργασίας θα μελετηθούν δεδομένα από τον κλάδο του τουρισμού, ο οποίος αποτελεί έναν από τους σημαντικότερους πυλώνες της ελληνικής οικονομίας, με αποτέλεσμα η ανάλυση του να θεωρείται σημαντικό πεδίο έρευνας. Ειδικότερα, θα μελετήσουμε τις μηνιαίες πληρότητες των 13 περιφερειών της Ελλάδας χρησιμοποιώντας στοιχεία από την ΕΛΣΤΑΤ. Οι συγκεκριμένες χρονοσειρές χαρακτηρίζονται από έντονη εποχικότητα, δηλαδή εμφανίζουν μια επαναλαμβανόμενη συμπεριφορά ανά έτος. Για τη μοντελοποίηση των παραπάνω δεδομένων θα χρησιμοποιηθούν οι προαναφερθείσες τεχνικές πρόβλεψης σε μία προσπάθεια να βρεθεί το καλύτερο πρότυπο ως προς τη μοντελοποίηση των δεδομένων και την πρόβλεψη μελλοντικών τιμών τους. Πιο συγκεκριμένα, θα πραγματοποιηθούν προβλέψεις για ένα χρονικό ορίζοντα ενός έτους χρησιμοποιώντας τα βέλτιστα εποχικά μοντέλα SARIMA, τα βέλτιστα ΤΝΔ και τα βέλτιστα Υβριδικά Μοντέλα. Εφαρμόζοντας τις συγκεκριμένες μεθόδους διαπιστώθηκε ότι δεν υπάρχει ενιαία βέλτιστο μοντέλο πρόβλεψης για όλες τις περιφέρειες οπότε προτείνεται ένας τρόπος επιλογής του καλύτερου μοντέλου με βάση ορισμένα χαρακτηριστικά των δεδομένων, στη συγκεκριμένη περίπτωση την εποχικότητα τους. Πιο συγκεκριμένα, χρησιμοποιείται ο συντελεστής Gini, ο οποίος είναι ένας δείκτης εποχικότητας. Με χρήση της ROC ανάλυσης και του δείκτη Youden εντοπίζεται το σημείο αποκοπής με βάση το οποίο επιλέγεται το καταλληλότερο μοντέλο για τα δεδομένα. Η ανάλυση και πρόβλεψη των μηνιαίων πληροτήτων των 13 περιφερειών της Ελλάδας χρησιμοποιώντας την προτεινόμενη μεθοδολογία είναι ιδιαίτερα ενθαρρυντική αφού σε μεγάλο ποσοστό επιλέχθηκε το σωστό μοντέλο πρόβλεψης και οι εκτιμώμενες τιμές ήταν πολύ κοντά στις πραγματικές. |
author2 |
Μαλεφάκη, Σόνια |
author_facet |
Μαλεφάκη, Σόνια Παναγοπούλου, Ευσταθία |
format |
Thesis |
author |
Παναγοπούλου, Ευσταθία |
author_sort |
Παναγοπούλου, Ευσταθία |
title |
Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
title_short |
Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
title_full |
Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
title_fullStr |
Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
title_full_unstemmed |
Πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
title_sort |
πρόβλεψη χρονοσειρών με έντονη εποχικότητα |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13878 |
work_keys_str_mv |
AT panagopouloueustathia problepsēchronoseirōnmeentonēepochikotēta AT panagopouloueustathia timeseriesforecastingwithintenseseasonality |
_version_ |
1771297274777829376 |
spelling |
nemertes-10889-138782022-09-05T20:32:47Z Πρόβλεψη χρονοσειρών με έντονη εποχικότητα Time series forecasting with intense seasonality Παναγοπούλου, Ευσταθία Μαλεφάκη, Σόνια Panagopoulou, Efstathia Πρόβλεψη xρονοσειρών Τεχνητά νευρωνικά δίκτυα Time series forecasting Artificial neural networks Σε πολλούς επιστημονικούς κλάδους συχνά χρειάζεται να παρακολουθούμε την εξέλιξη ορισμένων φαινομένων στο χρόνο και να κάνουμε προβλέψεις για μελλοντικές τιμές τους στηριζόμενοι σε διαθέσιμες παρατηρήσεις. Μία σειρά από παρατηρήσεις ενός φαινομένου οι οποίες γίνονται σε συγκεκριμένες ισαπέχουσες χρονικές στιγμές αποτελεί μία χρονοσειρά. Για τη μελέτη των χρονοσειρών μπορούν να χρησιμοποιηθούν διάφορες γραμμικές και μη-γραμμικές μέθοδοι όπως οι παραδοσιακές μέθοδοι πρόβλεψης (μοντέλα ARIMA/SARIMA), τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) και τα Υβριδικά Μοντέλα. Στο πλαίσιο αυτής της διπλωματικής εργασίας θα μελετηθούν δεδομένα από τον κλάδο του τουρισμού, ο οποίος αποτελεί έναν από τους σημαντικότερους πυλώνες της ελληνικής οικονομίας, με αποτέλεσμα η ανάλυση του να θεωρείται σημαντικό πεδίο έρευνας. Ειδικότερα, θα μελετήσουμε τις μηνιαίες πληρότητες των 13 περιφερειών της Ελλάδας χρησιμοποιώντας στοιχεία από την ΕΛΣΤΑΤ. Οι συγκεκριμένες χρονοσειρές χαρακτηρίζονται από έντονη εποχικότητα, δηλαδή εμφανίζουν μια επαναλαμβανόμενη συμπεριφορά ανά έτος. Για τη μοντελοποίηση των παραπάνω δεδομένων θα χρησιμοποιηθούν οι προαναφερθείσες τεχνικές πρόβλεψης σε μία προσπάθεια να βρεθεί το καλύτερο πρότυπο ως προς τη μοντελοποίηση των δεδομένων και την πρόβλεψη μελλοντικών τιμών τους. Πιο συγκεκριμένα, θα πραγματοποιηθούν προβλέψεις για ένα χρονικό ορίζοντα ενός έτους χρησιμοποιώντας τα βέλτιστα εποχικά μοντέλα SARIMA, τα βέλτιστα ΤΝΔ και τα βέλτιστα Υβριδικά Μοντέλα. Εφαρμόζοντας τις συγκεκριμένες μεθόδους διαπιστώθηκε ότι δεν υπάρχει ενιαία βέλτιστο μοντέλο πρόβλεψης για όλες τις περιφέρειες οπότε προτείνεται ένας τρόπος επιλογής του καλύτερου μοντέλου με βάση ορισμένα χαρακτηριστικά των δεδομένων, στη συγκεκριμένη περίπτωση την εποχικότητα τους. Πιο συγκεκριμένα, χρησιμοποιείται ο συντελεστής Gini, ο οποίος είναι ένας δείκτης εποχικότητας. Με χρήση της ROC ανάλυσης και του δείκτη Youden εντοπίζεται το σημείο αποκοπής με βάση το οποίο επιλέγεται το καταλληλότερο μοντέλο για τα δεδομένα. Η ανάλυση και πρόβλεψη των μηνιαίων πληροτήτων των 13 περιφερειών της Ελλάδας χρησιμοποιώντας την προτεινόμενη μεθοδολογία είναι ιδιαίτερα ενθαρρυντική αφού σε μεγάλο ποσοστό επιλέχθηκε το σωστό μοντέλο πρόβλεψης και οι εκτιμώμενες τιμές ήταν πολύ κοντά στις πραγματικές. In many scientific areas, we often need to monitor the advance of certain phenomena over time and make predictions about their future values based on available observations. A series of observations occurring at specific equidistant moments composes a time-series. In order to study time-series, various linear and non-linear methods such as traditional forecasting methods (ARIMA/SARIMA models), Artificial Neural Networks (ANN) and Hybrid Models can be utilized. In the framework of this thesis, data from the tourism sector will be analyzed. The tourism sector is among the most important pillars of the Greek economy, thus making its analysis an important area of research. In particular, we will study the monthly hotel occupancy rates for 13 Greek regions using data from ELSTAT. These time-series are characterized by intense seasonality, i.e. a repetitive behavior per year. To model these data, the aforementioned forecasting techniques will be implemented in our effort to find the best model that describes the time-series and predicts its future values. Specifically, forecasts will be produced for a one-year horizon, using the optimal SARIMA, ANN, and Hybrid models. Applying these methods, we ascertain that there is no single best forecast model for all regions. A way of selecting the optimal model based on specific data characteristics, in this case their seasonality, is proposed. More specifically, the Gini coefficient is used, which constitutes a seasonality index. Using the ROC analysis and the Youden index, the cutoff point is identified and the most appropriate model for the available data is selected based on this threshold. The analysis and forecast of the 13 regions of Greece using the proposed methodology are highly encouraging since the correct prediction model was chosen in most cases and the estimated values were very close to the actual ones. 2020-10-02T09:59:10Z 2020-10-02T09:59:10Z 2020 Thesis http://hdl.handle.net/10889/13878 gr 12 application/pdf |