Μέθοδοι πρόβλεψης χρονοσειρών με δεδομένα Covid-19

Η Ανάλυση Χρονοσειρών στοχεύει στη διερεύνηση του μηχανισμού δημιουργίας των δεδομένων (ερμηνεία της συμπεριφοράς και της φύσης του εκάστοτε φαινομένου) και στην ανίχνευση επαναλαμβανόμενων προτύπων της χρονοσειράς που οδηγούν σε χρήσιμα μοντέλα πρόβλεψης. Για την επίτευξη των στόχων αυτών, χρησιμο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Λουκοπούλου, Αικατερίνη Αμαλία
Άλλοι συγγραφείς: Loukopoulou, Aikaterini Amalia
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14788
Περιγραφή
Περίληψη:Η Ανάλυση Χρονοσειρών στοχεύει στη διερεύνηση του μηχανισμού δημιουργίας των δεδομένων (ερμηνεία της συμπεριφοράς και της φύσης του εκάστοτε φαινομένου) και στην ανίχνευση επαναλαμβανόμενων προτύπων της χρονοσειράς που οδηγούν σε χρήσιμα μοντέλα πρόβλεψης. Για την επίτευξη των στόχων αυτών, χρησιμοποιούνται θεμελιώδεις αλλά και πιο σύγχρονες μαθηματικές μέθοδοι, αξιοποιώντας δεδομένα ακολουθίας που συλλέγονται διαχρονικά. Ένα σύγχρονο φαινόμενο που ταλανίζει την παγκόσμια επιστημονική κοινότητα αποτελεί και η πανδημία της νόσου Coronavirus (Covid-19). Τα δεδομένα κρουσμάτων που συλλέγονται και καταγράφονται καθημερινά εμπίπτουν στην ανάλυση χρονοσειρών. Διάφοροι μαθηματικοί μηχανισμοί και μοντέλα προτείνονται για τον έλεγχο και την πρόβλεψη της πορείας της πανδημίας. Στόχος της παρούσας μελέτης είναι να μελετηθούν οι τεχνικές πρόβλεψης χρονοσειρών και να εφαρμοστούν στη πρόβλεψη του ημερήσιου αριθμού κρουσμάτων Covid-19. Πιο συγκεκριμένα χρησιμοποιήθηκαν δεδομένα που αντλήθηκαν από τη βάση δεδομένων https://coronavirus.jhu.edu/map.html τα οποία περιλάμβαναν το συνολικό αριθμό κρουσμάτων σε Ευρώπη, Νότια Αμερική αλλά και παγκοσμίως. Τα δεδομένα αυτά αφορούσαν την χρονική περίοδο από τον Ιανουάριο του 2020 μέχρι και τον Σεπτέμβριο της ίδιας χρονιάς και υλοποιήθηκε πρόβλεψη για 95 μέρες δηλαδή μέχρι και το τέλος του 2020. Η πρόβλεψη έγινε με εφαρμογή 3 μεθόδων: της μεθόδου μικτών αυτοπαλινδρούμενων μοντέλων κινητού μέσου - Auto Regressive Integrated Moving Average (ARIMA), κυβικών τμηματικών πολυωνύμων (piecewise cubic splines) και ομαλοποιημένων κυβικών πολυωνύμων (cubic smoothing splines). Για την βέλτιστη επιλογή των παραμέτρων p,d,q στο μοντέλο ARIMA χρησιμοποιήθηκε η μέθοδος auto.arima. Η αξιολόγηση των προβλεπτικών μοντέλων πραγματοποιήθηκε τόσο με δείκτες Akaike Information Criteria (AIC) και Bayesian Information Criteria (BIC) για τα μοντέλα ARIMA όσο και με τους δείκτες Root Mean Square Error (RMSE) και Mean Absolute Error (MAE), καθώς και με αξιολόγηση των γραφικών αναπαραστάσεων της συνάρτησης αυτοσυσχέτισης Auto Correlation Function (ACF) και μερικής αυτοσυσχέτισης Partial ACF (PACF). Τα αποτελέσματα καταδεικνύουν ότι σε όλες τις περιπτώσεις η μέθοδος πρόβλεψης με μοντέλα ARIMA έχει καλύτερη επίδοση σε σχέση με τη μέθοδο κυβικών τμηματικών πολυωνύμων τόσο ως προς το σφάλμα επίδοσης όσο και σε σύγκριση με τις πραγματικές τιμές που είναι γνωστές για την τελευταία μέρα πρόβλεψης (95η ) και η οποία μπορεί να αποτελέσει μέτρο σύγκρισης.