Ανάλυση δεδομένων χρόνιων παθήσεων με τεχνικές μηχανικής μάθησης

Η τεχνολογική πρόοδος και η ανάπτυξη της επιστήμης των υπολογιστών δίνει την δυνατότητα της επεξεργασίας μεγάλου όγκου ιατρικών δεδομένων και της εξαγωγής ωφέλιμων συμπερασμάτων. Τα οφέλη δεν περιορίζονται μόνο στον τομέα της επιστήμης των υπολογιστών αλλά και στον τομέα της υγείας όπου παρέχονται ν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Καλαματιανού, Δήμητρα
Άλλοι συγγραφείς: Kalamatianou, Dimitra
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://nemertes.library.upatras.gr/handle/10889/23282
Περιγραφή
Περίληψη:Η τεχνολογική πρόοδος και η ανάπτυξη της επιστήμης των υπολογιστών δίνει την δυνατότητα της επεξεργασίας μεγάλου όγκου ιατρικών δεδομένων και της εξαγωγής ωφέλιμων συμπερασμάτων. Τα οφέλη δεν περιορίζονται μόνο στον τομέα της επιστήμης των υπολογιστών αλλά και στον τομέα της υγείας όπου παρέχονται νέες δυνατότητες στο ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, για την έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων. Στόχος αυτής της διπλωματικής εργασίας είναι η δημιουργία ενός μοντέλου που μπορεί να προβλέψει σοβαρά ιατρικά συμβάντα για δύο διαφορετικά σετ δεδομένων, από δυο διαφορετικές ασθένειες, την νόσο Πάρκινσον και το σύνδρομο Ευθραυστότητας (Frailty). Επιπλέον στόχος αυτής της εργασίας είναι ο υπολογισμός της σημαντικότητας των χαρακτηριστικών που συνεισφέρουν στην προγνωστική δύναμη του μοντέλου, είτε θετικά είτε αρνητικά. Έτσι, επιλέγοντας μόνο κάποια από τα σημαντικότερα χαρακτηριστικά ελαττώνεται ο αριθμός των χαρακτηριστικών που εισέρχονται στην είσοδο του μοντέλου άρα και μειώνεται ο χρόνος επεξεργασίας και η πολυπλοκότητα του μοντέλου. Πέραν του θεωρητικού υποβάθρου που αναπτύχθηκε και αναλύθηκε, έγινε επεξεργασία των δεδομένων ώστε τα δύο σετ δεδομένων να είναι πανομοιότυπα. Αναπτύχθηκαν δύο μεθοδολογίες που καλούνται να ικανοποιήσουν τους στόχους της παρούσας διπλωματικής εργασίας. Κι οι δύο μεθοδολογίες έλυσαν το θέμα των μη ισορροπημένων σετ δεδομένων. Στην πρώτη μεθοδολογία επιστρατεύτηκαν αλγόριθμοι ταξινόμησης και τεχνικές undersampling και oversampling. Στην δεύτερη μεθοδολογία έγιναν πειραματικές διαδικασίες για την υλοποίηση του κατάλληλου προγνωστικού αναδρομικού νευρωνικού δικτύου, Long Short-Term Memory (LSTM), για το σετ δεδομένων που αφορά την νόσο του Πάρκινσον. Πάνω σε αυτό το μοντέλο με την τεχνική transfer learning υλοποιήθηκε ένα νέο μοντέλο που μπορεί να προβλέψει για το σετ δεδομένων που αφορά το σύνδρομο Ευθραυστότητας. Για την αντιμετώπιση των μη ισορροπημένων σετ δεδομένων χρησιμοποιήθηκαν class weights κατά την φάση της εκπαίδευσης. Επιπλέον, υπολογίστηκε η σημαντικότητα των χαρακτηριστικών (features). Τέλος, έγιναν δοκιμές στο μοντέλο με ένα μικρότερο σύνολο δεδομένων, το οποίο πλέον περιέχει μόνο τα 20 σημαντικότερα features που προέκυψαν. Εν κατακλείδι, τα συμπεράσματα που προέκυψαν από την εργασία εκτιμάται ότι θα συνεισφέρουν στην εξαγωγή χρήσιμων πληροφοριών από τα δεδομένα υγείας, προς όφελος των ατόμων που τους αφορούν οι εκάστοτε ασθένειες, νόσοι, σύνδρομα όσο και του λοιπού πληθυσμού. Επιπρόσθετα το ερευνητικό, ιατρικό και νοσηλευτικό προσωπικό, μπορεί να επωφεληθεί ώστε να επιτευχθεί έγκαιρη διάγνωση και θεραπεία σοβαρών ιατρικών συμβάντων, χωρίς να καταργείται η επιστημονική γνώση και γνώμη των ιατρών. Τα προγνωστικά μοντέλα θα δρουν συμβουλευτικά και συμπληρωματικά.