Μέθοδοι μηχανικής εκμάθησης από δεδομένα μεγάλης κλίμακας με εφαρμογή στην ανάλυση δικτύων της μοριακής βιολογίας και των νευροεπιστημών

Σε αυτή τη Διδακτορική Διατριβή ο σκοπός ήταν η δημιουργία και η ανάλυση βιολογικών δικτύων με χρήση μεθόδων Μηχανικής Εκμάθησης (Machine Learning). Προς αυτή την κατεύθυνση αναπτύχθηκαν νέες μεθοδολογίες για την μοντελοποίηση, την ανακατασκευή και την ανάλυση των δικτύων, παρέχοντας έγκυρα βιολογικ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Δημητρακόπουλος, Γεώργιος
Άλλοι συγγραφείς: Σγάρμπας, Κυριάκος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/11533
Περιγραφή
Περίληψη:Σε αυτή τη Διδακτορική Διατριβή ο σκοπός ήταν η δημιουργία και η ανάλυση βιολογικών δικτύων με χρήση μεθόδων Μηχανικής Εκμάθησης (Machine Learning). Προς αυτή την κατεύθυνση αναπτύχθηκαν νέες μεθοδολογίες για την μοντελοποίηση, την ανακατασκευή και την ανάλυση των δικτύων, παρέχοντας έγκυρα βιολογικά αποτελέσματα. Διάφορες τεχνικές, όπως συσταδοποίηση, ταξινόμηση, παλινδρόμηση και επιλογή χαρακτηριστικών συνδυάστηκαν επιτυχώς με την ανάλυση της θεωρίας γράφων για την μελέτη διαφορετικών ειδών βιολογικών δικτύων. Συγκεκριμένα, εξετάστηκαν δίκτυα από μικροσκοπική κλίμακα σε επίπεδο κυττάρου ως μακροσκοπική κλίμακα σε επίπεδο εγκεφαλικών δικτύων, προερχόμενα από δεδομένα της Μοριακής Βιολογίας και των Νευροεπιστημών, αντίστοιχα. Η Συστημική Βιολογία (Systems Biology) μελετά τους μηχανισμούς του κυττάρου ως σύστημα, με κύριο εργαλείο την θεωρία γράφων και τη χρήση ετερογενών πειραματικών δεδομένων της Μοριακής Βιολογίας. Στα δίκτυα της Μοριακής Βιολογίας θεωρούνται τα γονίδια, τα μόρια RNA και οι πρωτεΐνες ως κόμβοι για την μοντελοποίηση των πολύπλοκων αλληλεπιδράσεών τους και την ανάλυση της συμπεριφοράς τους σε πολύπλοκες ασθένειες και καταστάσεις, όπως η γήρανση και διάφοροι τύποι καρκίνου. Πιο αναλυτικά, δεδομένα μεγάλης κλίμακας μετρήσεων της γονιδιακής έκφρασης (μικροσυστοιχίες) χρησιμοποιήθηκαν είτε για τη δημιουργία δικτύων εκ νέου (de novo) είτε σε συνδυασμό με υπάρχοντα δίκτυα, όπως γονιδιακά ρυθμιστικά δίκτυα, δίκτυα πρωτεϊνικών αλληλεπιδράσεων και κυτταρικά μονοπάτια. Συγκεκριμένα, αναπτύχθηκαν μέθοδοι μοντελοποίησης των δικτύων με παλινδρομικά τυχαία δάση με σκοπό την πρόβλεψη νέων σχέσεων ή τον εντοπισμό διαταραχών στο δίκτυο. Επίσης, ως αποτέλεσμα της δικτυακής ανάλυσης ανιχνεύθηκαν σύνολα διαφοροποιημένων κόμβων μεταξύ διαφορετικών πειραματικών καταστάσεων, οι οποίοι μπορούν να αξιοποιηθούν για την ερμηνεία των επιδράσεων των ασθενειών και επιπλέον μπορούν να αποτελέσουν πιθανούς στόχους φαρμάκων. Στο πεδίο των Νευροεπιστημών, διεξήχθησαν πειράματα ηλεκτροεγκεφαλογραφίας υψηλής πυκνότητας αισθητήρων με στόχο τη μελέτη ανώτερης τάξης γνωστικών λειτουργιών, όπως το νοητικό φορτίο και η νοητική κόπωση. Από αυτά τα δεδομένα παράχθηκαν δίκτυα που αναπαριστούν τις αλληλεπιδράσεις μεταξύ των εγκεφαλικών περιοχών στο πεδίο συχνοτήτων, τα οποία αναλύθηκαν με μετρικές της θεωρίας γράφων. Στη συνέχεια, με χρήση αυτών των ζυγισμένων γράφων ως χαρακτηριστικών προς επιλογή και ταξινόμηση, εντοπίστηκε ένα μικρό υποδίκτυο σημαντικών αλληλεπιδράσεων με το οποίο επιτεύχθηκε υψηλή ακρίβεια στο διαχωρισμό μεταξύ των διαφορετικών καταστάσεων. Αυτό το υποδίκτυο μπορεί να συμβάλει στην κατανόηση των γνωστικών μηχανισμών και επιτρέπει την αποτελεσματική επιτήρηση της εγκεφαλικής δραστηριότητας.