Ανάπτυξη και βελτιστοποίηση μεθόδων κατηγοριοποίησης σε ιατρικά δεδομένα μεγάλου όγκου (big data)

Η επεξεργασία και η ανάλυση ιατρικών δεδομένων μεγάλου όγκου (ΜΟΙΔ) είναι ιδιαίτερα σημαντική σε αυτή την εποχή, όχι μόνο για την τροφοδότηση της ίδιας της Ιατρικής αυτής καθ’ αυτής με χρήσιμες πληροφορίες αλλά και για την ανάπτυξη ποικίλων αλγορίθμων κατηγοριοποίησης. Ο σκοπός των Αλγορίθμων Κατηγ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Φουρφουρής, Γεώργιος
Άλλοι συγγραφείς: Λυκοθανάσης, Σπυρίδων
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/11006
Περιγραφή
Περίληψη:Η επεξεργασία και η ανάλυση ιατρικών δεδομένων μεγάλου όγκου (ΜΟΙΔ) είναι ιδιαίτερα σημαντική σε αυτή την εποχή, όχι μόνο για την τροφοδότηση της ίδιας της Ιατρικής αυτής καθ’ αυτής με χρήσιμες πληροφορίες αλλά και για την ανάπτυξη ποικίλων αλγορίθμων κατηγοριοποίησης. Ο σκοπός των Αλγορίθμων Κατηγοριοποίησης της Μηχανικής Μάθησης είναι η παρατήρηση της συμπεριφοράς των δεδομένων σε σχέση με κάποια επιθυμητή έξοδο ή κάποιες επιθυμητές εξόδους. Η σημασία αυτών των αλγορίθμων είναι αξιοσημείωτη μιας και όχι μόνο μπορούν να εξάγουν αυτά τα χρήσιμα αποτελέσματα για την εκπαίδευση του νέου ιατρικού προσωπικού στο μέλλον ή τη δημιουργία εκπαιδευτικών προτύπων περιστατικών, αλλά επιπλέον μπορούν να το κάνουν και με μικρό ποσοστό λάθους, που στην πλειονότητα των περιπτώσεων είναι ελέγξιμο. Με άλλα λόγια, οι αλγόριθμοι αυτοί μπορούν να εκτιμήσουν τα ιατρικά δεδομένα με συγκεκριμένους παράγοντες επεξεργασίας, που έχουν εξαχθεί ή “εκμαιευτεί” από το έμπειρο ιατρικό προσωπικό, σε αντίθεση με τον άνθρωπο που δεν μπορεί πάντοτε να τα επεξεργάζεται με τον ίδιο ακριβώς τρόπο. Σε αυτή τη Διπλωματική Εργασία αρχικά θα αναλυθεί ένα μεγάλο πλήθος από ιατρικά δεδομένα που αφορούν στην πάθηση της καρδιακής αρρυθμίας και θα γίνει η προσπάθεια για κατηγοριοποίηση πάνω σε αυτά τα δεδομένα. Οι εν λόγω κατηγορίες είναι ήδη καθορισμένες από την Ιατρική. Πιο συγκεκριμένα, γίνεται λόγος για 16 κατηγορίες καρδιακής αρρυθμίας εκ των οποίων μία αναφέρεται στις φυσιολογικές μετρήσεις και άλλη μία σε όσες περιπτώσεις δεν υπάγονται στις υπόλοιπες 15 κατηγορίες. Με αυτόν τον τρόπο, η εργασία θα έχει σαν βασικό αντικείμενο μελέτης, ορισμένους αλγόριθμους Μηχανικής Μάθησης παρμένους από τη βιβλιογραφία, όπως ο Vote on Feature Intervals, ο K-Nearest Neighbors, είτε ο K-Nearest Neighbors on Feature Projections. Παρ’ όλ’ αυτά, η εργασία αυτή διαφοροποιείται σε σχέση με την υπάρχουσα βιβλιογραφία μέσα από την μελέτη όλων εκείνων των περιπτώσεων που αφενός μεν είναι απαραίτητοι για τη σωστή λειτουργία και εκτέλεση των αλγορίθμων κατηγοριοποίησης αφετέρου δε βελτιώνουν τα εξαγόμενα αποτελέσματα όπως είναι για παράδειγμα η ακρίβεια. Επιπρόσθετα, η έρευνα αυτή επεκτείνεται και μελετάει την ύπαρξη πλεοναζόντων ιατρικών μετρήσεων, τα οποία όποια ενδεχομένως επηρεάζουν την διαδικασία της κατηγοριοποίησης και κατά συνέπεια της ιατρικής διάγνωσης. Επομένως, μέσα από αυτή την μελέτη γίνεται προσπάθεια να επιτευχθεί η καλύτερη και αποδοτικότερη αξιοποίηση των εν λόγω ιατρικών δεδομένων και επιπλέον των διαφορετικών ή αντίστοιχου τύπου στοιχείων, μελλοντικά.