Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης
Η τεχνολογική πρόοδος και η ανάπτυξη της επιστήμης των υπολογιστών δίνει την δυνατότητα της επεξεργασίας μεγάλου όγκου ιατρικών δεδομένων και της εξαγωγής ωφέλιμων συμπερασμάτων. Τα οφέλη δεν περιορίζονται μόνο στον τομέα της επιστήμης των υπολογιστών αλλά και στον τομέα της υγείας όπου παρέχονται ν...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://nemertes.library.upatras.gr/handle/10889/23282 |
id |
nemertes-10889-23282 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Νόσος Πάρκινσον Σύνδρομο ευθραυστότητας Parkinson's disease Frailty |
spellingShingle |
Νόσος Πάρκινσον Σύνδρομο ευθραυστότητας Parkinson's disease Frailty Καλαματιανού, Δήμητρα Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
description |
Η τεχνολογική πρόοδος και η ανάπτυξη της επιστήμης των υπολογιστών δίνει την δυνατότητα της επεξεργασίας μεγάλου όγκου ιατρικών δεδομένων και της εξαγωγής ωφέλιμων συμπερασμάτων. Τα οφέλη δεν περιορίζονται μόνο στον τομέα της επιστήμης των υπολογιστών αλλά και στον τομέα της υγείας όπου παρέχονται νέες δυνατότητες στο ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, για την έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων.
Στόχος αυτής της διπλωματικής εργασίας είναι η δημιουργία ενός μοντέλου που μπορεί να προβλέψει σοβαρά ιατρικά συμβάντα για δύο διαφορετικά σετ δεδομένων, από δυο διαφορετικές ασθένειες, την νόσο Πάρκινσον και το σύνδρομο Ευθραυστότητας (Frailty). Επιπλέον στόχος αυτής της εργασίας είναι ο υπολογισμός της σημαντικότητας των χαρακτηριστικών που συνεισφέρουν στην προγνωστική δύναμη του μοντέλου, είτε θετικά είτε αρνητικά. Έτσι, επιλέγοντας μόνο κάποια από τα σημαντικότερα χαρακτηριστικά ελαττώνεται ο αριθμός των χαρακτηριστικών που εισέρχονται στην είσοδο του μοντέλου άρα και μειώνεται ο χρόνος επεξεργασίας και η πολυπλοκότητα του μοντέλου.
Πέραν του θεωρητικού υποβάθρου που αναπτύχθηκε και αναλύθηκε, έγινε επεξεργασία των δεδομένων ώστε τα δύο σετ δεδομένων να είναι πανομοιότυπα. Αναπτύχθηκαν δύο μεθοδολογίες που καλούνται να ικανοποιήσουν τους στόχους της παρούσας διπλωματικής εργασίας. Κι οι δύο μεθοδολογίες έλυσαν το θέμα των μη ισορροπημένων σετ δεδομένων. Στην πρώτη μεθοδολογία επιστρατεύτηκαν αλγόριθμοι ταξινόμησης και τεχνικές undersampling και oversampling. Στην δεύτερη μεθοδολογία έγιναν πειραματικές διαδικασίες για την υλοποίηση του κατάλληλου προγνωστικού αναδρομικού νευρωνικού δικτύου, Long Short-Term Memory (LSTM), για το σετ δεδομένων που αφορά την νόσο του Πάρκινσον. Πάνω σε αυτό το μοντέλο με την τεχνική transfer learning υλοποιήθηκε ένα νέο μοντέλο που μπορεί να προβλέψει για το σετ δεδομένων που αφορά το σύνδρομο Ευθραυστότητας. Για την αντιμετώπιση των μη ισορροπημένων σετ δεδομένων χρησιμοποιήθηκαν class weights κατά την φάση της εκπαίδευσης. Επιπλέον, υπολογίστηκε η σημαντικότητα των χαρακτηριστικών (features). Τέλος, έγιναν δοκιμές στο μοντέλο με ένα μικρότερο σύνολο δεδομένων, το οποίο πλέον περιέχει μόνο τα 20 σημαντικότερα features που προέκυψαν.
Εν κατακλείδι, τα συμπεράσματα που προέκυψαν από την εργασία εκτιμάται ότι θα συνεισφέρουν στην εξαγωγή χρήσιμων πληροφοριών από τα δεδομένα υγείας, προς όφελος των ατόμων που τους αφορούν οι εκάστοτε ασθένειες, νόσοι, σύνδρομα όσο και του λοιπού πληθυσμού. Επιπρόσθετα το ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, μπορεί να επωφεληθεί ώστε να επιτευχθεί έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων, χωρίς να καταργείται η επιστημονική γνώση και γνώμη των ιατρών. Τα προγνωστικά μοντέλα θα δρουν συμβουλευτικά και συμπληρωματικά. |
author2 |
Kalamatianou, Dimitra |
author_facet |
Kalamatianou, Dimitra Καλαματιανού, Δήμητρα |
author |
Καλαματιανού, Δήμητρα |
author_sort |
Καλαματιανού, Δήμητρα |
title |
Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
title_short |
Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
title_full |
Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
title_fullStr |
Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
title_full_unstemmed |
Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
title_sort |
ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης |
publishDate |
2022 |
url |
https://nemertes.library.upatras.gr/handle/10889/23282 |
work_keys_str_mv |
AT kalamatianoudēmētra analysēdedomenōnchroniōnpathēseōnmetechnikesmēchanikēsmathēsēs AT kalamatianoudēmētra chronicdiseasedataanalysiswithmachinelearningtechniques |
_version_ |
1771297240058429440 |
spelling |
nemertes-10889-232822022-09-24T06:21:57Z Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης Chronic disease data analysis with machine learning techniques Καλαματιανού, Δήμητρα Kalamatianou, Dimitra Νόσος Πάρκινσον Σύνδρομο ευθραυστότητας Parkinson's disease Frailty Η τεχνολογική πρόοδος και η ανάπτυξη της επιστήμης των υπολογιστών δίνει την δυνατότητα της επεξεργασίας μεγάλου όγκου ιατρικών δεδομένων και της εξαγωγής ωφέλιμων συμπερασμάτων. Τα οφέλη δεν περιορίζονται μόνο στον τομέα της επιστήμης των υπολογιστών αλλά και στον τομέα της υγείας όπου παρέχονται νέες δυνατότητες στο ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, για την έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων. Στόχος αυτής της διπλωματικής εργασίας είναι η δημιουργία ενός μοντέλου που μπορεί να προβλέψει σοβαρά ιατρικά συμβάντα για δύο διαφορετικά σετ δεδομένων, από δυο διαφορετικές ασθένειες, την νόσο Πάρκινσον και το σύνδρομο Ευθραυστότητας (Frailty). Επιπλέον στόχος αυτής της εργασίας είναι ο υπολογισμός της σημαντικότητας των χαρακτηριστικών που συνεισφέρουν στην προγνωστική δύναμη του μοντέλου, είτε θετικά είτε αρνητικά. Έτσι, επιλέγοντας μόνο κάποια από τα σημαντικότερα χαρακτηριστικά ελαττώνεται ο αριθμός των χαρακτηριστικών που εισέρχονται στην είσοδο του μοντέλου άρα και μειώνεται ο χρόνος επεξεργασίας και η πολυπλοκότητα του μοντέλου. Πέραν του θεωρητικού υποβάθρου που αναπτύχθηκε και αναλύθηκε, έγινε επεξεργασία των δεδομένων ώστε τα δύο σετ δεδομένων να είναι πανομοιότυπα. Αναπτύχθηκαν δύο μεθοδολογίες που καλούνται να ικανοποιήσουν τους στόχους της παρούσας διπλωματικής εργασίας. Κι οι δύο μεθοδολογίες έλυσαν το θέμα των μη ισορροπημένων σετ δεδομένων. Στην πρώτη μεθοδολογία επιστρατεύτηκαν αλγόριθμοι ταξινόμησης και τεχνικές undersampling και oversampling. Στην δεύτερη μεθοδολογία έγιναν πειραματικές διαδικασίες για την υλοποίηση του κατάλληλου προγνωστικού αναδρομικού νευρωνικού δικτύου, Long Short-Term Memory (LSTM), για το σετ δεδομένων που αφορά την νόσο του Πάρκινσον. Πάνω σε αυτό το μοντέλο με την τεχνική transfer learning υλοποιήθηκε ένα νέο μοντέλο που μπορεί να προβλέψει για το σετ δεδομένων που αφορά το σύνδρομο Ευθραυστότητας. Για την αντιμετώπιση των μη ισορροπημένων σετ δεδομένων χρησιμοποιήθηκαν class weights κατά την φάση της εκπαίδευσης. Επιπλέον, υπολογίστηκε η σημαντικότητα των χαρακτηριστικών (features). Τέλος, έγιναν δοκιμές στο μοντέλο με ένα μικρότερο σύνολο δεδομένων, το οποίο πλέον περιέχει μόνο τα 20 σημαντικότερα features που προέκυψαν. Εν κατακλείδι, τα συμπεράσματα που προέκυψαν από την εργασία εκτιμάται ότι θα συνεισφέρουν στην εξαγωγή χρήσιμων πληροφοριών από τα δεδομένα υγείας, προς όφελος των ατόμων που τους αφορούν οι εκάστοτε ασθένειες, νόσοι, σύνδρομα όσο και του λοιπού πληθυσμού. Επιπρόσθετα το ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, μπορεί να επωφεληθεί ώστε να επιτευχθεί έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων, χωρίς να καταργείται η επιστημονική γνώση και γνώμη των ιατρών. Τα προγνωστικά μοντέλα θα δρουν συμβουλευτικά και συμπληρωματικά. Technological progress and the development of computer science make it possible to process large amounts of medical data and draw useful conclusions. The benefits are not only limited to the field of computer science but also to the field of health where new possibilities are provided to research, medical and nursing staff, for the early diagnosis and treatment of serious medical events. The aim of this thesis is to create a model that can predict serious medical events for two different data sets, from two different diseases, Parkinson's disease and Frailty syndrome. An additional objective of this work is to calculate the importance of the features that contribute to the predictive power of the model, either positively or negatively. Thus, by selecting only some of the most important features, the number of features entering the model input is reduced, thus reducing the processing time and the complexity of the model. In addition to the theoretical background developed and analyzed, the data were processed so that the two data sets were identical. Two methodologies were developed to meet the objectives of this thesis. Both methodologies solved the issue of imbalanced data sets. In the first methodology, classification algorithms and undersampling and oversampling techniques were employed. In the second methodology, experimental procedures were carried out to implement the appropriate prognostic recurrent neural network, Long Short-Term Memory (LSTM), for the data set concerning Parkinson's disease. On this model, by the transfer learning technique, a new model was implemented that can predict the data set concerning the Frailty syndrome. To deal with imbalanced data sets, class weights were used during the training phase. In addition, the importance of features was calculated. Finally, the model was tested with a smaller data set, which now contains only the 20 most important features that emerged. The conclusions obtained from the work are estimated to contribute to the extraction of useful information from the health data, for the benefit of the people affected by the respective illnesses, diseases, syndromes and the rest of the population. In addition, research, medical and nursing staff can benefit in order to achieve early diagnosis and treatment of serious medical events, without abolishing the scientific knowledge and opinion of doctors. The predictive models will act in an advisory and complementary way. 2022-09-22T05:24:00Z 2022-09-22T05:24:00Z 2022-09-08 https://nemertes.library.upatras.gr/handle/10889/23282 el application/pdf |