Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks

Η όλο ένα και επιταχυνόμενη ανάπτυξη μεθόδων μάθησης Η/Υ παράλληλα με την ανάγκη του ιατροφαρμακευτικού τομέα για καλύτερη κατανόηση των βιολογικών διαδικασιών, έχει φέρει στο προσκήνιο τον διεπιστημονικό κλάδο της βιοπληροφορικης. H συστηματική αναζήτηση του συνόλου των αλληλεπιδράσεων των μικρών κ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αυγερινός, Βασίλειος Χαράλαμπος
Άλλοι συγγραφείς: Avgerinos, Vasileios Charalampos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23640
Περιγραφή
Περίληψη:Η όλο ένα και επιταχυνόμενη ανάπτυξη μεθόδων μάθησης Η/Υ παράλληλα με την ανάγκη του ιατροφαρμακευτικού τομέα για καλύτερη κατανόηση των βιολογικών διαδικασιών, έχει φέρει στο προσκήνιο τον διεπιστημονικό κλάδο της βιοπληροφορικης. H συστηματική αναζήτηση του συνόλου των αλληλεπιδράσεων των μικρών και μεγάλων μορίων στο εσωτερικό του κυττάρου, που αποτελεί το δομικό λίθο κάθε έμβιου οργανισμού, μπορεί να συμβάλει δραματικά στην καλύτερη κατανόηση της οργάνωσης και συμπεριφοράς του και επομένως να προσφέρει νέες πληροφορίες στην προσπάθεια για αντιμετώπιση και πρόληψη ασθενειών μέσω της αποδοτικής και ταχείας δημιουργίας φαρμάκων. Από τις σημαντικότερες αλληλεπιδράσεις που λαμβάνουν χώρα, είναι αυτές μεταξύ των πρωτεϊνών, που επιτελούν έναν από τους πιο πολυσυνθέτους ρόλους, διαβιβάζοντας μηνύματα, καταλύοντας αντιδράσεις ή συντελώντας στην διατήρηση της δομής του κυττάρου. Η προσπάθεια συλλογής και συγκέντρωσης των διάφορων αλληλεπιδράσεων πρωτεΐνης με πρωτεΐνη συμπεριλαμβάνει, από πειραματικές μεθόδους μέχρι μεθόδους ανάλυσης της βιβλιογραφίας με text-mining. H παρούσα διπλωματική εργασία ασχολείται με την δημιουργία, εκπαίδευση και αξιολόγηση ενός μοντέλου πρόβλεψης αλληλεπιδράσεων πρωτεϊνών με χρήση βαθιάς μάθησης (deep learning) και συγκεκριμένα χρησιμοποιώντας Graph Neural Networks (GNN) που αποτελούν ιδιαίτερα καλή αρχιτεκτονική για την περιγραφή δεδομένων με εγγενή δομή γράφου. Ως εκ τούτου τα ακόλουθα εξετάζονται αναλυτικά στην εργασία: α) Η εύρεση, ανάλυση και επεξεργασία υψηλής ποιότητας δεδομένων πρωτεϊνικών αλληλεπιδράσεων, β) Η δημιουργία παραδειγμάτων αρνητικών αλληλεπιδράσεων για την εκπαίδευση του μοντέλου γ) Η δημιουργία μιας σταθερού μήκους αναπαράστασης της κάθε πρωτεΐνης που διατηρεί τις δομικές και φυσικοχημικές ιδιότητες της, δ) Η αναζήτηση της αρχιτεκτονικής του μοντέλου που γενικεύει καλύτερα σε άγνωστα δεδομένα ε) Και τέλος η εκπαίδευση και αξιολόγηση του εν λόγω μοντέλου παράλληλα με την αναζήτηση των καταλλήλων υπερπαραμέτρων.