Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning
H συγκεκριμένη διπλωματική εργασία επιχειρεί την επίλυση του προβλήματος της πρόβλεψης των Συνολικών Θανάτων και των Συνολικών Κρουσμάτων από τον ιό Covid-19, μέσω ανάπτυξης προβλεπτικών μοντέλων. Τα μοντέλα που αναπτύχθηκαν παρέχουν πρόβλεψη για τα Συνολικά Κρούσματα και τους Συνολικούς Θανάτους γι...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/24567 |
id |
nemertes-10889-24567 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-245672024-03-08T19:28:20Z Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning Time series prediction from covid-19 data using deep learning Δουρδουνάς, Αριστείδης Ανάργυρος Dourdounas, Aristeidis Anargyros Επιδημιολογικά δεδομένα κορωνοιού Νευρωνικά δίκτυα Μηχανική μάθηση Αναδρομικά νευρωνικά δίκτυα Πρόβλεψη κρουσμάτων κορωνοιού Πρόβλεψη θανάτων κορωνοιού Πρόβλεψη χρονοσειρών Covid-19 Neural networks LSTM ARIMA Total cases prediction Total deaths prediction Machine learning Time series prediction H συγκεκριμένη διπλωματική εργασία επιχειρεί την επίλυση του προβλήματος της πρόβλεψης των Συνολικών Θανάτων και των Συνολικών Κρουσμάτων από τον ιό Covid-19, μέσω ανάπτυξης προβλεπτικών μοντέλων. Τα μοντέλα που αναπτύχθηκαν παρέχουν πρόβλεψη για τα Συνολικά Κρούσματα και τους Συνολικούς Θανάτους για έναν ορίζοντα 7, 14, 30 και 60 ημερών. Εξετάστηκαν δύο διαφορετικοί τύποι προβλεπτικών μοντέλων: Τα Long Short Term Memory (LSTM) Neural Networks και τα Auto Regressive Integrated Moving Average (ARIMA) Μοντέλα. Τα LSTM είναι μία υποκατηγορία των Αναδρομικών Νευρωνικών δικτύων (RNN) που είναι τροποποιημένη κατά τέτοιο τρόπο ώστε το Νευρωνικό Δίκτυο να μπορεί να εκπαιδευτεί σε δεδομένα μεγάλων χρονοσειρών, ξεπερνώντας το Vanishing/Exploding Gradient πρόβλημα, από το οποίο πάσχουν τα απλά Αναδρομικά δίκτυα. Τα ARIMA είναι στατιστικά μοντέλα τα οποία χρησιμοποιούνται κατά κόρον για την πρόβλεψη δεδομένων Χρονοσειρών, είναι αρκετά απλά στην υλοποίηση τους και μπορούν να παρέχουν αξιόπιστες προβλέψεις για σύντομα χρονικά διαστήματα. Η τελική λύση που προτείνεται για την πρόβλεψη των Συνολικών Κρουσμάτων και των Συνολικών Θανάτων από τον Covid-19 στην Ελλάδα είναι η χρήση δύο μοντέλων Stacked LSTM, ένα για τα συνολικά κρούσματα και ένα για τους συνολικούς θανάτους. Το μοντέλο για πρόβλεψη Συνολικών Κρουσμάτων εκπαιδεύτηκε σε δύο χαρακτηριστικά: Στα Συνολικά Κρούσματα και στα Συνολικά Κρούσματα ανά εκατομμύριο. Αντίστοιχα, το μοντέλο για τους Συνολικούς θανάτους εκπαιδεύτηκε: στους Συνολικούς Θανάτους και στους Συνολικούς Θανάτους ανά εκατομμύριο. Τα μοντέλα που χρησιμοποιήθηκαν ήταν τριών LSTM στρωμάτων (Layers). Οι εποχές εκπαίδευσης των δύο μοντέλων επιλέχθηκαν με χρήση της μεθόδου Early Stopping. Οι προβλέψεις των μοντέλων αυτών είχαν τα χαμηλότερα Mean Absolute Percentage Error Σφάλματα για 7, 14, 30, και 60 ημέρες. The goal of this paper is to develop two predicational models, one for the prediction of Covid-19’s Total Cases and one for the prediction of Covid-19’s Total Deaths, for Greece. The models are going to have a prediction horizon of 7, 14,30 and 60 days ahead of the training Set. This paper examines the usage of two different models. The first model is a Long Short-Term Memory (LSTM) Neural Network model and the second one is an Auto Regressive Integrated Moving Average Model (ARIMA). An LSTM model is a Recurrent Neural Network Model that is modified in a specific way that allows it to learn longer time sequences. An ARIMA model is a very common statistical model that is used in time series prediction, that offers reliable long-term predictions and is simpler to develop, in comparison with a neural network. The proposed solution of the paper is the usage of two Stacked LSTM models with Multiple Features, one for Total Cases and one for Total Death prediction. Both models were trained on two Features. The Total Cases Prediction model was trained on the Total Cases and the Total Cases Per Million Features. The Total Deaths Prediction model was trained on the Total Deaths and the Total Deaths Per Million Features. Both models used three LSTM Layers. The number of training epochs was determined by the Early Stopping training method. Both models gave the most accurate predictions, in terms of mean absolute percentage error, for 7, 14, 30 and 60 days ahead of the training set. 2023-02-24T08:13:31Z 2023-02-24T08:13:31Z 2023-11-28 https://hdl.handle.net/10889/24567 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Επιδημιολογικά δεδομένα κορωνοιού Νευρωνικά δίκτυα Μηχανική μάθηση Αναδρομικά νευρωνικά δίκτυα Πρόβλεψη κρουσμάτων κορωνοιού Πρόβλεψη θανάτων κορωνοιού Πρόβλεψη χρονοσειρών Covid-19 Neural networks LSTM ARIMA Total cases prediction Total deaths prediction Machine learning Time series prediction |
spellingShingle |
Επιδημιολογικά δεδομένα κορωνοιού Νευρωνικά δίκτυα Μηχανική μάθηση Αναδρομικά νευρωνικά δίκτυα Πρόβλεψη κρουσμάτων κορωνοιού Πρόβλεψη θανάτων κορωνοιού Πρόβλεψη χρονοσειρών Covid-19 Neural networks LSTM ARIMA Total cases prediction Total deaths prediction Machine learning Time series prediction Δουρδουνάς, Αριστείδης Ανάργυρος Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
description |
H συγκεκριμένη διπλωματική εργασία επιχειρεί την επίλυση του προβλήματος της πρόβλεψης των Συνολικών Θανάτων και των Συνολικών Κρουσμάτων από τον ιό Covid-19, μέσω ανάπτυξης προβλεπτικών μοντέλων. Τα μοντέλα που αναπτύχθηκαν παρέχουν πρόβλεψη για τα Συνολικά Κρούσματα και τους Συνολικούς Θανάτους για έναν ορίζοντα 7, 14, 30 και 60 ημερών. Εξετάστηκαν δύο διαφορετικοί τύποι προβλεπτικών μοντέλων: Τα Long Short Term Memory (LSTM) Neural Networks και τα Auto Regressive Integrated Moving Average (ARIMA) Μοντέλα.
Τα LSTM είναι μία υποκατηγορία των Αναδρομικών Νευρωνικών δικτύων (RNN) που είναι τροποποιημένη κατά τέτοιο τρόπο ώστε το Νευρωνικό Δίκτυο να μπορεί να εκπαιδευτεί σε δεδομένα μεγάλων χρονοσειρών, ξεπερνώντας το Vanishing/Exploding Gradient πρόβλημα, από το οποίο πάσχουν τα απλά Αναδρομικά δίκτυα. Τα ARIMA είναι στατιστικά μοντέλα τα οποία χρησιμοποιούνται κατά κόρον για την πρόβλεψη δεδομένων Χρονοσειρών, είναι αρκετά απλά στην υλοποίηση τους και μπορούν να παρέχουν αξιόπιστες προβλέψεις για σύντομα χρονικά διαστήματα.
Η τελική λύση που προτείνεται για την πρόβλεψη των Συνολικών Κρουσμάτων και των Συνολικών Θανάτων από τον Covid-19 στην Ελλάδα είναι η χρήση δύο μοντέλων Stacked LSTM, ένα για τα συνολικά κρούσματα και ένα για τους συνολικούς θανάτους. Το μοντέλο για πρόβλεψη Συνολικών Κρουσμάτων εκπαιδεύτηκε σε δύο χαρακτηριστικά: Στα Συνολικά Κρούσματα και στα Συνολικά Κρούσματα ανά εκατομμύριο. Αντίστοιχα, το μοντέλο για τους Συνολικούς θανάτους εκπαιδεύτηκε: στους Συνολικούς Θανάτους και στους Συνολικούς Θανάτους ανά εκατομμύριο. Τα μοντέλα που χρησιμοποιήθηκαν ήταν τριών LSTM στρωμάτων (Layers). Οι εποχές εκπαίδευσης των δύο μοντέλων επιλέχθηκαν με χρήση της μεθόδου Early Stopping. Οι προβλέψεις των μοντέλων αυτών είχαν τα χαμηλότερα Mean Absolute Percentage Error Σφάλματα για 7, 14, 30, και 60 ημέρες. |
author2 |
Dourdounas, Aristeidis Anargyros |
author_facet |
Dourdounas, Aristeidis Anargyros Δουρδουνάς, Αριστείδης Ανάργυρος |
author |
Δουρδουνάς, Αριστείδης Ανάργυρος |
author_sort |
Δουρδουνάς, Αριστείδης Ανάργυρος |
title |
Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
title_short |
Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
title_full |
Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
title_fullStr |
Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
title_full_unstemmed |
Πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
title_sort |
πρόβλεψη χρονοσειρών από επιδημιολογικά δεδομένα covid-19 με χρήση μεθόδων deep learning |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/24567 |
work_keys_str_mv |
AT dourdounasaristeidēsanargyros problepsēchronoseirōnapoepidēmiologikadedomenacovid19mechrēsēmethodōndeeplearning AT dourdounasaristeidēsanargyros timeseriespredictionfromcovid19datausingdeeplearning |
_version_ |
1799945012493942784 |