Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης

Η SARS-CoV-2 (Severe Acute Respiratory Syndrome) είναι μια μολυσματική ασθένεια που μεταδίδεται από άνθρωπο σε άνθρωπο και έκανε την εμφάνισή της τον Δεκέμβριο του 2019 σε μια πόλη της Κίνας, την Wuhan. Μετά από πολλές καταγεγραμμένες περιπτώσεις εμφάνισης του ιού σε όλο τον κόσμο, στις 11 Μαρτίου 2...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Λυμπέρη, Αναστασία
Άλλοι συγγραφείς: Lymperi, Anastasia
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25284
id nemertes-10889-25284
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Κορονοϊός
Μηχανική μάθηση
Μοντέλο SIR
Μοντέλο παλινδρόμησης
Πρόβλεψη κρουσμάτων
Πρόβλεψη θανάτων
Covid-19
Coronavirus
Machine learning
SIR model
Regression model
Case prediction
Death prediction
spellingShingle Κορονοϊός
Μηχανική μάθηση
Μοντέλο SIR
Μοντέλο παλινδρόμησης
Πρόβλεψη κρουσμάτων
Πρόβλεψη θανάτων
Covid-19
Coronavirus
Machine learning
SIR model
Regression model
Case prediction
Death prediction
Λυμπέρη, Αναστασία
Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
description Η SARS-CoV-2 (Severe Acute Respiratory Syndrome) είναι μια μολυσματική ασθένεια που μεταδίδεται από άνθρωπο σε άνθρωπο και έκανε την εμφάνισή της τον Δεκέμβριο του 2019 σε μια πόλη της Κίνας, την Wuhan. Μετά από πολλές καταγεγραμμένες περιπτώσεις εμφάνισης του ιού σε όλο τον κόσμο, στις 11 Μαρτίου 2020 ο Παγκόσμιος Οργανισμός Υγείας (World Health Organization – WHO) αύξησε την εκτίμηση του ως πανδημία σε παγκόσμιο επίπεδο. Στην Ελλάδα έχουν καταγραφεί 5.920.428 επιβεβαιωμένα κρούσματα και 36.447 χιλιάδες θάνατοι μέχρι και τον Μάρτιο του 2023. Τα άτομα που νοσούν εμφανίζουν συμπτώματα πνευμονίας, άλλοτε σε ήπια, κι άλλοτε σε βαριά μορφή και τότε χρήζουν νοσηλείας. Ο COVID – 19 φαίνεται να μεταδίδεται μέσω των σταγονιδίων, για αυτό και τα περισσότερα μέτρα που έχουν ληφθεί από τις κυβερνήσεις, ώστε να μειωθούν τα κρούσματα και κατά συνέπεια η εξάπλωση του ιού, στοχεύουν - αφορούν την όσο γίνεται μικρότερη συγκέντρωση ατόμων, ειδικά σε κλειστούς χώρους, την υποχρεωτική χρήση μάσκας σε όλους τους χώρους και υποχρεωτική τηλεργασία σε μεγάλο ποσοστό των εργαζομένων σε πολλές επιχειρήσεις. Η χρήση γνωστών μαθηματικών επιδημιολογικών μοντέλων (SIR) και παραλλαγές αυτών ανάλογα με τις συνθήκες, τα οποία περιλαμβάνουν τις ευπαθείς ομάδες, τους ασθενείς και αυτούς που πεθαίνουν ή αναρρώνουν, μας βοηθά στην περαιτέρω κατανόηση της επιδημίας και της εξέλιξης της. Όμως οι περιορισμένοι βαθμοί ελευθερίας τους, καθώς και η ανάγκη για εκτίμηση εκ των προτέρων κάποιων παραμέτρων τους και συγχρόνως, η μη δυνατότητα μεταφοράς μοντέλων μεταξύ κρατών λόγω εγγενών διαφορών, κάνει αναγκαία την χρήση μοντέλων μηχανικής μάθησης για την δημιουργία αποδοτικότερων μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων από Covid-19. Στην παρούσα διπλωματική, ασχοληθήκαμε με δεδομένα που αφορούν συγκεκριμένα την Ελλάδα (ελεύθερα διαθέσιμα από το European Centre for Disease Prevention and Control). Με τη βοήθεια των παραπάνω μοντέλων και μέσω εργαλείων τεχνητής νοημοσύνης, χρησιμοποιήσαμε ιστορικά δεδομένα για κρούσματα, εμβολιασμούς, θανάτους, εισαγωγές σε νοσοκομεία κ.α., για το διάστημα από 27 Μαρτίου 2020 έως και τις 5 Μαΐου 2021 για την εκπαίδευση μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων σε ορίζοντα ημέρας, εβδομάδας και μήνα. Ύστερα από την εκπαίδευση των συγκεκριμένων μοντέλων, εφαρμόσαμε τα εκπαιδευμένα μοντέλα σε μοντέλα επαλήθευσης με σκοπό να εξετάσουμε την καταλληλόλητα του μοντέλου για τα δεδομένα του κορονοϊού και διαπιστώσαμε ότι το μοντέλο μηχανικής μάθησης μας δίνει αρκετά ικανοποιητικά αποτελέσματα, ειδικά όσον αφορά βραχυπρόθεσμες προβλέψεις κρουσμάτων. Παράλληλα, εξετάσαμε την αποδοτικότητα του κλασσικού επιδημιολογικού μοντέλου SIR στα δεδομένα της Ελλάδας, για τις προβλέψεις της επόμενης μέρας, της επόμενης εβδομάδας και του επόμενου μήνα, για τα κρούσματα και τους θανάτους αντίστοιχα, το οποίο με τη σειρά του δίνει ακόμα πιο ικανοποιητικά αποτελέσματα για την πρόβλεψη των κρουσμάτων, αλλά δεν συμβαίνει το ίδιο και για την πρόβλεψη των θανάτων για οποιοδήποτε χρονικό διάστημα μελετήσαμε. Έπειτα από σύγκριση των δύο μοντέλων, διαπιστώσαμε ότι το επιδημιολογικό μοντέλο ανταποκρίνεται καλύτερα στην πρόβλεψη των κρουσμάτων για το επόμενο χρονικό διάστημα σε σχέση με το μοντέλο παλινδρόμησης, ενώ και τα δύο φαίνεται να παρουσιάζουν αδυναμία στην πρόβλεψη θανάτων για μεγάλο χρονικό διάστημα από την περίοδο που μελετάμε. Τέλος, μελετάμε την δυνατότητα επέκτασης του μοντέλου ώστε να λαμβάνει καθημερινά καινούρια δεδομένα και να ανανεώνεται η λίστα, ώστε να παράγονται νέες προβλέψεις.
author2 Lymperi, Anastasia
author_facet Lymperi, Anastasia
Λυμπέρη, Αναστασία
author Λυμπέρη, Αναστασία
author_sort Λυμπέρη, Αναστασία
title Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
title_short Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
title_full Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
title_fullStr Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
title_full_unstemmed Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης
title_sort μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από covid – 19 στην ελλάδα με χρήση μεθόδων μηχανικής μάθησης
publishDate 2023
url https://hdl.handle.net/10889/25284
work_keys_str_mv AT lymperēanastasia montelopoiēsēchronoseirōnkrousmatōnkaithanatōnapocovid19stēnelladamechrēsēmethodōnmēchanikēsmathēsēs
AT lymperēanastasia timeseriesmodelingofcasesanddeathsfromcovid19ingreeceusingmachinelearningmethods
_version_ 1771297232540139520
spelling nemertes-10889-252842023-07-04T03:56:32Z Μοντελοποίηση χρονοσειρών κρουσμάτων και θανάτων από Covid – 19 στην Ελλάδα με χρήση μεθόδων μηχανικής μάθησης Time series modeling of cases and deaths from Covid – 19 in Greece using machine learning methods Λυμπέρη, Αναστασία Lymperi, Anastasia Κορονοϊός Μηχανική μάθηση Μοντέλο SIR Μοντέλο παλινδρόμησης Πρόβλεψη κρουσμάτων Πρόβλεψη θανάτων Covid-19 Coronavirus Machine learning SIR model Regression model Case prediction Death prediction Η SARS-CoV-2 (Severe Acute Respiratory Syndrome) είναι μια μολυσματική ασθένεια που μεταδίδεται από άνθρωπο σε άνθρωπο και έκανε την εμφάνισή της τον Δεκέμβριο του 2019 σε μια πόλη της Κίνας, την Wuhan. Μετά από πολλές καταγεγραμμένες περιπτώσεις εμφάνισης του ιού σε όλο τον κόσμο, στις 11 Μαρτίου 2020 ο Παγκόσμιος Οργανισμός Υγείας (World Health Organization – WHO) αύξησε την εκτίμηση του ως πανδημία σε παγκόσμιο επίπεδο. Στην Ελλάδα έχουν καταγραφεί 5.920.428 επιβεβαιωμένα κρούσματα και 36.447 χιλιάδες θάνατοι μέχρι και τον Μάρτιο του 2023. Τα άτομα που νοσούν εμφανίζουν συμπτώματα πνευμονίας, άλλοτε σε ήπια, κι άλλοτε σε βαριά μορφή και τότε χρήζουν νοσηλείας. Ο COVID – 19 φαίνεται να μεταδίδεται μέσω των σταγονιδίων, για αυτό και τα περισσότερα μέτρα που έχουν ληφθεί από τις κυβερνήσεις, ώστε να μειωθούν τα κρούσματα και κατά συνέπεια η εξάπλωση του ιού, στοχεύουν - αφορούν την όσο γίνεται μικρότερη συγκέντρωση ατόμων, ειδικά σε κλειστούς χώρους, την υποχρεωτική χρήση μάσκας σε όλους τους χώρους και υποχρεωτική τηλεργασία σε μεγάλο ποσοστό των εργαζομένων σε πολλές επιχειρήσεις. Η χρήση γνωστών μαθηματικών επιδημιολογικών μοντέλων (SIR) και παραλλαγές αυτών ανάλογα με τις συνθήκες, τα οποία περιλαμβάνουν τις ευπαθείς ομάδες, τους ασθενείς και αυτούς που πεθαίνουν ή αναρρώνουν, μας βοηθά στην περαιτέρω κατανόηση της επιδημίας και της εξέλιξης της. Όμως οι περιορισμένοι βαθμοί ελευθερίας τους, καθώς και η ανάγκη για εκτίμηση εκ των προτέρων κάποιων παραμέτρων τους και συγχρόνως, η μη δυνατότητα μεταφοράς μοντέλων μεταξύ κρατών λόγω εγγενών διαφορών, κάνει αναγκαία την χρήση μοντέλων μηχανικής μάθησης για την δημιουργία αποδοτικότερων μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων από Covid-19. Στην παρούσα διπλωματική, ασχοληθήκαμε με δεδομένα που αφορούν συγκεκριμένα την Ελλάδα (ελεύθερα διαθέσιμα από το European Centre for Disease Prevention and Control). Με τη βοήθεια των παραπάνω μοντέλων και μέσω εργαλείων τεχνητής νοημοσύνης, χρησιμοποιήσαμε ιστορικά δεδομένα για κρούσματα, εμβολιασμούς, θανάτους, εισαγωγές σε νοσοκομεία κ.α., για το διάστημα από 27 Μαρτίου 2020 έως και τις 5 Μαΐου 2021 για την εκπαίδευση μοντέλων πρόβλεψης των κρουσμάτων και των θανάτων σε ορίζοντα ημέρας, εβδομάδας και μήνα. Ύστερα από την εκπαίδευση των συγκεκριμένων μοντέλων, εφαρμόσαμε τα εκπαιδευμένα μοντέλα σε μοντέλα επαλήθευσης με σκοπό να εξετάσουμε την καταλληλόλητα του μοντέλου για τα δεδομένα του κορονοϊού και διαπιστώσαμε ότι το μοντέλο μηχανικής μάθησης μας δίνει αρκετά ικανοποιητικά αποτελέσματα, ειδικά όσον αφορά βραχυπρόθεσμες προβλέψεις κρουσμάτων. Παράλληλα, εξετάσαμε την αποδοτικότητα του κλασσικού επιδημιολογικού μοντέλου SIR στα δεδομένα της Ελλάδας, για τις προβλέψεις της επόμενης μέρας, της επόμενης εβδομάδας και του επόμενου μήνα, για τα κρούσματα και τους θανάτους αντίστοιχα, το οποίο με τη σειρά του δίνει ακόμα πιο ικανοποιητικά αποτελέσματα για την πρόβλεψη των κρουσμάτων, αλλά δεν συμβαίνει το ίδιο και για την πρόβλεψη των θανάτων για οποιοδήποτε χρονικό διάστημα μελετήσαμε. Έπειτα από σύγκριση των δύο μοντέλων, διαπιστώσαμε ότι το επιδημιολογικό μοντέλο ανταποκρίνεται καλύτερα στην πρόβλεψη των κρουσμάτων για το επόμενο χρονικό διάστημα σε σχέση με το μοντέλο παλινδρόμησης, ενώ και τα δύο φαίνεται να παρουσιάζουν αδυναμία στην πρόβλεψη θανάτων για μεγάλο χρονικό διάστημα από την περίοδο που μελετάμε. Τέλος, μελετάμε την δυνατότητα επέκτασης του μοντέλου ώστε να λαμβάνει καθημερινά καινούρια δεδομένα και να ανανεώνεται η λίστα, ώστε να παράγονται νέες προβλέψεις. SARS-CoV-2 (Severe Acute Respiratory Syndrome) is an infectious disease that spreads from person to person and appeared in December 2019 in a Chinese city, Wuhan. After many recorded cases of the virus around the world, on March 11, 2020, the World Health Organization (WHO) increased its assessment as a global pandemic. In Greece, 5,920,428 confirmed cases and 36,447 thousand deaths have been recorded until March 2023. People who are sick show symptoms of pneumonia, sometimes mild, sometimes severe, and then they need hospitalization. COVID-19 appears to be transmitted through droplets, which is why most of the measures taken by governments to reduce cases and consequently the spread of the virus are aimed at the smallest possible concentration of people, especially in closed areas, the mandatory use of masks in all areas and mandatory telecommuting for a large percentage of employees in many companies. The use of well-known mathematical epidemiological models (SIRs) and their variations depending on the conditions, which include the vulnerable groups, the sick and those who die or recover, helps us to further understand the epidemic and its evolution. However, their limited degrees of freedom, as well as the need to estimate some of their parameters in advance and, at the same time, the inability to transfer models between countries due to inherent differences, make it necessary to use machine learning models to create more efficient models for predicting cases and deaths from Covid-19. In this dissertation, we dealt with data specific to Greece (freely available from the European Center for Disease Prevention and Control). With the help of the above models and through artificial intelligence tools, we used historical data on cases, vaccinations, deaths, hospital admissions, etc., from 27th of March 2020, to 5th of May 2021 for to train case prediction models and deaths by day, week, and month. After training the specific models, we applied the trained models to verification models to examine the suitability of the model for the coronavirus data and found that the machine learning model gives us quite satisfactory results, especially in terms of short-term case predictions. At the same time, we examined the efficiency of the classical SIR epidemiological model on the data of Greece, for the predictions of the next day, the next week and the next month, for cases and deaths respectively, which in turn gives even more satisfactory results for the prediction of cases, but the same is not the case for the prediction of deaths for any period of time we studied. After comparing the two models, we found that the epidemiologic model performs better in predicting cases for the next period than the regression model, while both seem to show weakness in predicting deaths for a long period of time than the period under study . Finally, we are studying the possibility of expanding the model so that it receives daily new data and renews the list, so that new forecasts are produced. 2023-07-03T05:44:41Z 2023-07-03T05:44:41Z 2023-03-30 https://hdl.handle.net/10889/25284 el application/pdf