Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα

Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αναστασίου, Ευτυχία
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13208
id nemertes-10889-13208
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Βιοπληροφορική
Μηχανική μάθηση
Επιτηρούμενη κατηγοριοποίηση
Εργαλείο με γραφικά διεπαφής χρήστη
Bioinformatics
Machine learning
Supervised classification
Tool with graphical user interface
Python
Tkinter
spellingShingle Βιοπληροφορική
Μηχανική μάθηση
Επιτηρούμενη κατηγοριοποίηση
Εργαλείο με γραφικά διεπαφής χρήστη
Bioinformatics
Machine learning
Supervised classification
Tool with graphical user interface
Python
Tkinter
Αναστασίου, Ευτυχία
Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
description Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις συνεχίστηκαν, με σημείο αναφοράς τις αρχές του 21ου αιώνα, όπου ολοκληρώθηκε το πρόγραμμα χαρτογράφησης του ανθρώπινου γονιδιόματος (Human Genome Project). Η αποκρυπτογράφηση του γενετικού μας υλικού έδωσε το έναυσμα για την ανάπτυξη υπολογιστικών εργαλείων που θα βοηθούσαν στη συγκέντρωση, την αποθήκευση και την ανάλυση βιολογικών πληροφοριών. Ένας τρόπος εκμετάλλευσης των βιολογικών δεδομένων είναι η χρήση αλγορίθμων μηχανικής μάθησης προκειμένου να δημιουργηθούν μοντέλα που εκπαιδεύονται με τα δεδομένα και παράγουν καινούργια γνώση. Η παρούσα διπλωματική εργασία χωρίζεται σε τέσσερα μέρη. Στο πρώτο κεφάλαιο γίνεται μια αναφορά σε βασικές έννοιες της Μοριακής Βιολογίας και της Βιοπληροφορικής για να αποκτήσουμε μια καλύτερη εικόνα στο είδος της πληροφορίας που πρόκειται να αξιοποιήσουμε στη συνέχεια. Ακολούθως, παρουσιάζονται βασικοί αλγόριθμοι μηχανικής μάθησης που θα χρησιμοποιούμε σε προβλήματα κατηγοριοποίησης όπως είναι ο Naive Bayes και τα δέντρα απόφασης. Στο τρίτο κεφάλαιο, αναλύονται τα βήματα που πρέπει να ακολουθήσουμε για τη δημιουργία ενός μοντέλου μηχανικής μάθησης, όπως είναι ο καθαρισμός και η επεξεργασία των δεδομένων, η επιλογή κατάλληλου αλγορίθμου και η αξιολόγηση της ακρίβειας του μοντέλου. Στο τέταρτο κεφάλαιο, παρουσιάζεται το πρόγραμμα που κατασκευάστηκε στα πλαίσια της εργασίας σε γλώσσα προγραμματισμού Python, προκειμένου να παρέχει μια συλλογή από εργαλεία οπτικοποίησης και επεξεργασίας δεδομένων, αλγορίθμους κατηγοριοποίησης, μεθόδους αξιολόγησης και ακρίβειας για την προγνωστική μοντελοποίηση μαζί με γραφικές διεπαφές χρήστη για εύκολη πρόσβαση σε αυτές τις λειτουργίες. Τέλος, χρησιμοποιείται το πρόγραμμα για την κατασκευή ενός μοντέλου πρόγνωσης της ασθένειας σακχαρώδη διαβήτη.
author2 Κωτσιαντής, Σωτήριος
author_facet Κωτσιαντής, Σωτήριος
Αναστασίου, Ευτυχία
format Thesis
author Αναστασίου, Ευτυχία
author_sort Αναστασίου, Ευτυχία
title Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
title_short Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
title_full Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
title_fullStr Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
title_full_unstemmed Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
title_sort αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα
publishDate 2020
url http://hdl.handle.net/10889/13208
work_keys_str_mv AT anastasioueutychia algorithmoimēchanikēsmathēsēskaiepharmogesseiatrobiologikaproblēmata
AT anastasioueutychia machinelearningalgorithmsandapplicationstobiomedicalproblems
_version_ 1771297261481885696
spelling nemertes-10889-132082022-09-05T14:10:08Z Αλγόριθμοι μηχανικής μάθησης και εφαρμογές σε ιατροβιολογικά προβλήματα Machine learning algorithms and applications to biomedical problems Αναστασίου, Ευτυχία Κωτσιαντής, Σωτήριος Γράψα, Θεοδούλα Κωτσιαντής, Σωτήριος Ράγγος, Όμηρος Anastasiou, Eftychia Βιοπληροφορική Μηχανική μάθηση Επιτηρούμενη κατηγοριοποίηση Εργαλείο με γραφικά διεπαφής χρήστη Bioinformatics Machine learning Supervised classification Tool with graphical user interface Python Tkinter Στη διάρκεια του 20ου αιώνα τα επιτεύγματα της επιστημονικής κοινότητας στον τομέα της ιατρικής και της βιολογίας συνείσφεραν στη δημιουργία και την ανάπτυξη διαγνωστικών και θεραπευτικών παρεμβάσεων όπως τα αντιβιοτικά, τα εμβόλια κ.α., αλλάζοντας ριζικά τις ζωές των ανθρώπων. Οι ραγδαίες εξελίξεις συνεχίστηκαν, με σημείο αναφοράς τις αρχές του 21ου αιώνα, όπου ολοκληρώθηκε το πρόγραμμα χαρτογράφησης του ανθρώπινου γονιδιόματος (Human Genome Project). Η αποκρυπτογράφηση του γενετικού μας υλικού έδωσε το έναυσμα για την ανάπτυξη υπολογιστικών εργαλείων που θα βοηθούσαν στη συγκέντρωση, την αποθήκευση και την ανάλυση βιολογικών πληροφοριών. Ένας τρόπος εκμετάλλευσης των βιολογικών δεδομένων είναι η χρήση αλγορίθμων μηχανικής μάθησης προκειμένου να δημιουργηθούν μοντέλα που εκπαιδεύονται με τα δεδομένα και παράγουν καινούργια γνώση. Η παρούσα διπλωματική εργασία χωρίζεται σε τέσσερα μέρη. Στο πρώτο κεφάλαιο γίνεται μια αναφορά σε βασικές έννοιες της Μοριακής Βιολογίας και της Βιοπληροφορικής για να αποκτήσουμε μια καλύτερη εικόνα στο είδος της πληροφορίας που πρόκειται να αξιοποιήσουμε στη συνέχεια. Ακολούθως, παρουσιάζονται βασικοί αλγόριθμοι μηχανικής μάθησης που θα χρησιμοποιούμε σε προβλήματα κατηγοριοποίησης όπως είναι ο Naive Bayes και τα δέντρα απόφασης. Στο τρίτο κεφάλαιο, αναλύονται τα βήματα που πρέπει να ακολουθήσουμε για τη δημιουργία ενός μοντέλου μηχανικής μάθησης, όπως είναι ο καθαρισμός και η επεξεργασία των δεδομένων, η επιλογή κατάλληλου αλγορίθμου και η αξιολόγηση της ακρίβειας του μοντέλου. Στο τέταρτο κεφάλαιο, παρουσιάζεται το πρόγραμμα που κατασκευάστηκε στα πλαίσια της εργασίας σε γλώσσα προγραμματισμού Python, προκειμένου να παρέχει μια συλλογή από εργαλεία οπτικοποίησης και επεξεργασίας δεδομένων, αλγορίθμους κατηγοριοποίησης, μεθόδους αξιολόγησης και ακρίβειας για την προγνωστική μοντελοποίηση μαζί με γραφικές διεπαφές χρήστη για εύκολη πρόσβαση σε αυτές τις λειτουργίες. Τέλος, χρησιμοποιείται το πρόγραμμα για την κατασκευή ενός μοντέλου πρόγνωσης της ασθένειας σακχαρώδη διαβήτη. During the 20th century, scientific advances in medicine and biology had contributed to the creation and development of diagnostic and therapeutic interventions such as antibiotics, vaccines etc., radically changing people’s lives. The rapid developments continued and in the early 21st century a new benchmark for humanity was reached, as the project for mapping the human genome was completed (Human Genome Project). The decryption of our genetic material led to the development of computational tools which help us to collect, save, and analyse biological information. One way of exploiting the biological data is by using machine learning algorithms in order to create models which are trained with data and generate new knowledge. This thesis is divided into four parts. In the first chapter, there is a reference to the basic concepts of Molecular Biology and Bioinformatics to get a better idea of the kind of information that we are going to use later. Secondly, basic algorithms of machine learning are presented which are used to solve classification problems such as Naïve Bayes, Neural Networks and decision trees. In the third chapter, there is a detailed description of the steps we should follow in order to create a machine learning model, such as “cleaning” and processing data, selecting the right algorithm and evaluating a model’s accuracy. In the last chapter, the program that was developed in Python programming language is presented, which provide a collection of visualization and data processing tools, classification algorithms, estimation and precision modelling methods along with graphical user interfaces for easy access to these functions. Finally, the program is used to build a model for predicting susceptibility to diabetes mellitus. 2020-02-11T09:29:37Z 2020-02-11T09:29:37Z 2019-09 Thesis http://hdl.handle.net/10889/13208 gr 0 application/pdf