Περίληψη: | H συγκεκριμένη διπλωματική εργασία επιχειρεί την επίλυση του προβλήματος της πρόβλεψης των Συνολικών Θανάτων και των Συνολικών Κρουσμάτων από τον ιό Covid-19, μέσω ανάπτυξης προβλεπτικών μοντέλων. Τα μοντέλα που αναπτύχθηκαν παρέχουν πρόβλεψη για τα Συνολικά Κρούσματα και τους Συνολικούς Θανάτους για έναν ορίζοντα 7, 14, 30 και 60 ημερών. Εξετάστηκαν δύο διαφορετικοί τύποι προβλεπτικών μοντέλων: Τα Long Short Term Memory (LSTM) Neural Networks και τα Auto Regressive Integrated Moving Average (ARIMA) Μοντέλα.
Τα LSTM είναι μία υποκατηγορία των Αναδρομικών Νευρωνικών δικτύων (RNN) που είναι τροποποιημένη κατά τέτοιο τρόπο ώστε το Νευρωνικό Δίκτυο να μπορεί να εκπαιδευτεί σε δεδομένα μεγάλων χρονοσειρών, ξεπερνώντας το Vanishing/Exploding Gradient πρόβλημα, από το οποίο πάσχουν τα απλά Αναδρομικά δίκτυα. Τα ARIMA είναι στατιστικά μοντέλα τα οποία χρησιμοποιούνται κατά κόρον για την πρόβλεψη δεδομένων Χρονοσειρών, είναι αρκετά απλά στην υλοποίηση τους και μπορούν να παρέχουν αξιόπιστες προβλέψεις για σύντομα χρονικά διαστήματα.
Η τελική λύση που προτείνεται για την πρόβλεψη των Συνολικών Κρουσμάτων και των Συνολικών Θανάτων από τον Covid-19 στην Ελλάδα είναι η χρήση δύο μοντέλων Stacked LSTM, ένα για τα συνολικά κρούσματα και ένα για τους συνολικούς θανάτους. Το μοντέλο για πρόβλεψη Συνολικών Κρουσμάτων εκπαιδεύτηκε σε δύο χαρακτηριστικά: Στα Συνολικά Κρούσματα και στα Συνολικά Κρούσματα ανά εκατομμύριο. Αντίστοιχα, το μοντέλο για τους Συνολικούς θανάτους εκπαιδεύτηκε: στους Συνολικούς Θανάτους και στους Συνολικούς Θανάτους ανά εκατομμύριο. Τα μοντέλα που χρησιμοποιήθηκαν ήταν τριών LSTM στρωμάτων (Layers). Οι εποχές εκπαίδευσης των δύο μοντέλων επιλέχθηκαν με χρήση της μεθόδου Early Stopping. Οι προβλέψεις των μοντέλων αυτών είχαν τα χαμηλότερα Mean Absolute Percentage Error Σφάλματα για 7, 14, 30, και 60 ημέρες.
|