Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα

Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αναστασίου, Ευτυχία
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13208
Περιγραφή
Περίληψη:Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις συνεχίστηκαν, με σημείο αναφοράς τις αρχές του 21ου αιώνα, όπου ολοκληρώθηκε το πρόγραμμα χαρτογράφησης του ανθρώπινου γονιδιόματος (Human Genome Project). Η αποκρυπτογράφηση του γενετικού μας υλικού έδωσε το έναυσμα για την ανάπτυξη υπολογιστικών εργαλείων που θα βοηθούσαν στη συγκέντρωση, την αποθήκευση και την ανάλυση βιολογικών πληροφοριών. Ένας τρόπος εκμετάλλευσης των βιολογικών δεδομένων είναι η χρήση αλγορίθμων μηχανικής μάθησης προκειμένου να δημιουργηθούν μοντέλα που εκπαιδεύονται με τα δεδομένα και παράγουν καινούργια γνώση. Η παρούσα διπλωματική εργασία χωρίζεται σε τέσσερα μέρη. Στο πρώτο κεφάλαιο γίνεται μια αναφορά σε βασικές έννοιες της Μοριακής Βιολογίας και της Βιοπληροφορικής για να αποκτήσουμε μια καλύτερη εικόνα στο είδος της πληροφορίας που πρόκειται να αξιοποιήσουμε στη συνέχεια. Ακολούθως, παρουσιάζονται βασικοί αλγόριθμοι μηχανικής μάθησης που θα χρησιμοποιούμε σε προβλήματα κατηγοριοποίησης όπως είναι ο Naive Bayes και τα δέντρα απόφασης. Στο τρίτο κεφάλαιο, αναλύονται τα βήματα που πρέπει να ακολουθήσουμε για τη δημιουργία ενός μοντέλου μηχανικής μάθησης, όπως είναι ο καθαρισμός και η επεξεργασία των δεδομένων, η επιλογή κατάλληλου αλγορίθμου και η αξιολόγηση της ακρίβειας του μοντέλου. Στο τέταρτο κεφάλαιο, παρουσιάζεται το πρόγραμμα που κατασκευάστηκε στα πλαίσια της εργασίας σε γλώσσα προγραμματισμού Python, προκειμένου να παρέχει μια συλλογή από εργαλεία οπτικοποίησης και επεξεργασίας δεδομένων, αλγορίθμους κατηγοριοποίησης, μεθόδους αξιολόγησης και ακρίβειας για την προγνωστική μοντελοποίηση μαζί με γραφικές διεπαφές χρήστη για εύκολη πρόσβαση σε αυτές τις λειτουργίες. Τέλος, χρησιμοποιείται το πρόγραμμα για την κατασκευή ενός μοντέλου πρόγνωσης της ασθένειας σακχαρώδη διαβήτη.