Πρόβλεψη χρονοσειρών με έντονη εποχικότητα

Σε πολλούς επιστημονικούς κλάδους συχνά χρειάζεται να παρακολουθούμε την εξέλιξη ορισμένων φαινομένων στο χρόνο και να κάνουμε προβλέψεις για μελλοντικές τιμές τους στηριζόμενοι σε διαθέσιμες παρατηρήσεις. Μία σειρά από παρατηρήσεις ενός φαινομένου οι οποίες γίνονται σε συγκεκριμένες ισαπέχουσες χρο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παναγοπούλου, Ευσταθία
Άλλοι συγγραφείς: Μαλεφάκη, Σόνια
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13878
Περιγραφή
Περίληψη:Σε πολλούς επιστημονικούς κλάδους συχνά χρειάζεται να παρακολουθούμε την εξέλιξη ορισμένων φαινομένων στο χρόνο και να κάνουμε προβλέψεις για μελλοντικές τιμές τους στηριζόμενοι σε διαθέσιμες παρατηρήσεις. Μία σειρά από παρατηρήσεις ενός φαινομένου οι οποίες γίνονται σε συγκεκριμένες ισαπέχουσες χρονικές στιγμές αποτελεί μία χρονοσειρά. Για τη μελέτη των χρονοσειρών μπορούν να χρησιμοποιηθούν διάφορες γραμμικές και μη-γραμμικές μέθοδοι όπως οι παραδοσιακές μέθοδοι πρόβλεψης (μοντέλα ARIMA/SARIMA), τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) και τα Υβριδικά Μοντέλα. Στο πλαίσιο αυτής της διπλωματικής εργασίας θα μελετηθούν δεδομένα από τον κλάδο του τουρισμού, ο οποίος αποτελεί έναν από τους σημαντικότερους πυλώνες της ελληνικής οικονομίας, με αποτέλεσμα η ανάλυση του να θεωρείται σημαντικό πεδίο έρευνας. Ειδικότερα, θα μελετήσουμε τις μηνιαίες πληρότητες των 13 περιφερειών της Ελλάδας χρησιμοποιώντας στοιχεία από την ΕΛΣΤΑΤ. Οι συγκεκριμένες χρονοσειρές χαρακτηρίζονται από έντονη εποχικότητα, δηλαδή εμφανίζουν μια επαναλαμβανόμενη συμπεριφορά ανά έτος. Για τη μοντελοποίηση των παραπάνω δεδομένων θα χρησιμοποιηθούν οι προαναφερθείσες τεχνικές πρόβλεψης σε μία προσπάθεια να βρεθεί το καλύτερο πρότυπο ως προς τη μοντελοποίηση των δεδομένων και την πρόβλεψη μελλοντικών τιμών τους. Πιο συγκεκριμένα, θα πραγματοποιηθούν προβλέψεις για ένα χρονικό ορίζοντα ενός έτους χρησιμοποιώντας τα βέλτιστα εποχικά μοντέλα SARIMA, τα βέλτιστα ΤΝΔ και τα βέλτιστα Υβριδικά Μοντέλα. Εφαρμόζοντας τις συγκεκριμένες μεθόδους διαπιστώθηκε ότι δεν υπάρχει ενιαία βέλτιστο μοντέλο πρόβλεψης για όλες τις περιφέρειες οπότε προτείνεται ένας τρόπος επιλογής του καλύτερου μοντέλου με βάση ορισμένα χαρακτηριστικά των δεδομένων, στη συγκεκριμένη περίπτωση την εποχικότητα τους. Πιο συγκεκριμένα, χρησιμοποιείται ο συντελεστής Gini, ο οποίος είναι ένας δείκτης εποχικότητας. Με χρήση της ROC ανάλυσης και του δείκτη Youden εντοπίζεται το σημείο αποκοπής με βάση το οποίο επιλέγεται το καταλληλότερο μοντέλο για τα δεδομένα. Η ανάλυση και πρόβλεψη των μηνιαίων πληροτήτων των 13 περιφερειών της Ελλάδας χρησιμοποιώντας την προτεινόμενη μεθοδολογία είναι ιδιαίτερα ενθαρρυντική αφού σε μεγάλο ποσοστό επιλέχθηκε το σωστό μοντέλο πρόβλεψης και οι εκτιμώμενες τιμές ήταν πολύ κοντά στις πραγματικές.