Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks

Η όλο ένα και επιταχυνόμενη ανάπτυξη μεθόδων μάθησης Η/Υ παράλληλα με την ανάγκη του ιατροφαρμακευτικού τομέα για καλύτερη κατανόηση των βιολογικών διαδικασιών, έχει φέρει στο προσκήνιο τον διεπιστημονικό κλάδο της βιοπληροφορικης. H συστηματική αναζήτηση του συνόλου των αλληλεπιδράσεων των μικρών κ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αυγερινός, Βασίλειος Χαράλαμπος
Άλλοι συγγραφείς: Avgerinos, Vasileios Charalampos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23640
id nemertes-10889-23640
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Βαθιά μάθηση
Νευρωνικά δίκτυα
Βιοπληροφορική
Γραφήματα
Deep learning
Neural networks
Bioinformatics
Graphs
spellingShingle Βαθιά μάθηση
Νευρωνικά δίκτυα
Βιοπληροφορική
Γραφήματα
Deep learning
Neural networks
Bioinformatics
Graphs
Αυγερινός, Βασίλειος Χαράλαμπος
Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
description Η όλο ένα και επιταχυνόμενη ανάπτυξη μεθόδων μάθησης Η/Υ παράλληλα με την ανάγκη του ιατροφαρμακευτικού τομέα για καλύτερη κατανόηση των βιολογικών διαδικασιών, έχει φέρει στο προσκήνιο τον διεπιστημονικό κλάδο της βιοπληροφορικης. H συστηματική αναζήτηση του συνόλου των αλληλεπιδράσεων των μικρών και μεγάλων μορίων στο εσωτερικό του κυττάρου, που αποτελεί το δομικό λίθο κάθε έμβιου οργανισμού, μπορεί να συμβάλει δραματικά στην καλύτερη κατανόηση της οργάνωσης και συμπεριφοράς του και επομένως να προσφέρει νέες πληροφορίες στην προσπάθεια για αντιμετώπιση και πρόληψη ασθενειών μέσω της αποδοτικής και ταχείας δημιουργίας φαρμάκων. Από τις σημαντικότερες αλληλεπιδράσεις που λαμβάνουν χώρα, είναι αυτές μεταξύ των πρωτεϊνών, που επιτελούν έναν από τους πιο πολυσυνθέτους ρόλους, διαβιβάζοντας μηνύματα, καταλύοντας αντιδράσεις ή συντελώντας στην διατήρηση της δομής του κυττάρου. Η προσπάθεια συλλογής και συγκέντρωσης των διάφορων αλληλεπιδράσεων πρωτεΐνης με πρωτεΐνη συμπεριλαμβάνει, από πειραματικές μεθόδους μέχρι μεθόδους ανάλυσης της βιβλιογραφίας με text-mining. H παρούσα διπλωματική εργασία ασχολείται με την δημιουργία, εκπαίδευση και αξιολόγηση ενός μοντέλου πρόβλεψης αλληλεπιδράσεων πρωτεϊνών με χρήση βαθιάς μάθησης (deep learning) και συγκεκριμένα χρησιμοποιώντας Graph Neural Networks (GNN) που αποτελούν ιδιαίτερα καλή αρχιτεκτονική για την περιγραφή δεδομένων με εγγενή δομή γράφου. Ως εκ τούτου τα ακόλουθα εξετάζονται αναλυτικά στην εργασία: α) Η εύρεση, ανάλυση και επεξεργασία υψηλής ποιότητας δεδομένων πρωτεϊνικών αλληλεπιδράσεων, β) Η δημιουργία παραδειγμάτων αρνητικών αλληλεπιδράσεων για την εκπαίδευση του μοντέλου γ) Η δημιουργία μιας σταθερού μήκους αναπαράστασης της κάθε πρωτεΐνης που διατηρεί τις δομικές και φυσικοχημικές ιδιότητες της, δ) Η αναζήτηση της αρχιτεκτονικής του μοντέλου που γενικεύει καλύτερα σε άγνωστα δεδομένα ε) Και τέλος η εκπαίδευση και αξιολόγηση του εν λόγω μοντέλου παράλληλα με την αναζήτηση των καταλλήλων υπερπαραμέτρων.
author2 Avgerinos, Vasileios Charalampos
author_facet Avgerinos, Vasileios Charalampos
Αυγερινός, Βασίλειος Χαράλαμπος
author Αυγερινός, Βασίλειος Χαράλαμπος
author_sort Αυγερινός, Βασίλειος Χαράλαμπος
title Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
title_short Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
title_full Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
title_fullStr Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
title_full_unstemmed Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
title_sort πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks
publishDate 2022
url https://hdl.handle.net/10889/23640
work_keys_str_mv AT augerinosbasileioscharalampos problepsēallēlepidrasēsprōteïnōnmegraphneuralnetworks
AT augerinosbasileioscharalampos predictionofproteinproteininteractionswithgraphneuralnetworks
_version_ 1771297298460966912
spelling nemertes-10889-236402022-11-04T04:37:02Z Πρόβλεψη αλληλεπίδρασης πρωτεϊνών με graph neural networks Prediction of protein protein interactions with graph neural networks Αυγερινός, Βασίλειος Χαράλαμπος Avgerinos, Vasileios Charalampos Βαθιά μάθηση Νευρωνικά δίκτυα Βιοπληροφορική Γραφήματα Deep learning Neural networks Bioinformatics Graphs Η όλο ένα και επιταχυνόμενη ανάπτυξη μεθόδων μάθησης Η/Υ παράλληλα με την ανάγκη του ιατροφαρμακευτικού τομέα για καλύτερη κατανόηση των βιολογικών διαδικασιών, έχει φέρει στο προσκήνιο τον διεπιστημονικό κλάδο της βιοπληροφορικης. H συστηματική αναζήτηση του συνόλου των αλληλεπιδράσεων των μικρών και μεγάλων μορίων στο εσωτερικό του κυττάρου, που αποτελεί το δομικό λίθο κάθε έμβιου οργανισμού, μπορεί να συμβάλει δραματικά στην καλύτερη κατανόηση της οργάνωσης και συμπεριφοράς του και επομένως να προσφέρει νέες πληροφορίες στην προσπάθεια για αντιμετώπιση και πρόληψη ασθενειών μέσω της αποδοτικής και ταχείας δημιουργίας φαρμάκων. Από τις σημαντικότερες αλληλεπιδράσεις που λαμβάνουν χώρα, είναι αυτές μεταξύ των πρωτεϊνών, που επιτελούν έναν από τους πιο πολυσυνθέτους ρόλους, διαβιβάζοντας μηνύματα, καταλύοντας αντιδράσεις ή συντελώντας στην διατήρηση της δομής του κυττάρου. Η προσπάθεια συλλογής και συγκέντρωσης των διάφορων αλληλεπιδράσεων πρωτεΐνης με πρωτεΐνη συμπεριλαμβάνει, από πειραματικές μεθόδους μέχρι μεθόδους ανάλυσης της βιβλιογραφίας με text-mining. H παρούσα διπλωματική εργασία ασχολείται με την δημιουργία, εκπαίδευση και αξιολόγηση ενός μοντέλου πρόβλεψης αλληλεπιδράσεων πρωτεϊνών με χρήση βαθιάς μάθησης (deep learning) και συγκεκριμένα χρησιμοποιώντας Graph Neural Networks (GNN) που αποτελούν ιδιαίτερα καλή αρχιτεκτονική για την περιγραφή δεδομένων με εγγενή δομή γράφου. Ως εκ τούτου τα ακόλουθα εξετάζονται αναλυτικά στην εργασία: α) Η εύρεση, ανάλυση και επεξεργασία υψηλής ποιότητας δεδομένων πρωτεϊνικών αλληλεπιδράσεων, β) Η δημιουργία παραδειγμάτων αρνητικών αλληλεπιδράσεων για την εκπαίδευση του μοντέλου γ) Η δημιουργία μιας σταθερού μήκους αναπαράστασης της κάθε πρωτεΐνης που διατηρεί τις δομικές και φυσικοχημικές ιδιότητες της, δ) Η αναζήτηση της αρχιτεκτονικής του μοντέλου που γενικεύει καλύτερα σε άγνωστα δεδομένα ε) Και τέλος η εκπαίδευση και αξιολόγηση του εν λόγω μοντέλου παράλληλα με την αναζήτηση των καταλλήλων υπερπαραμέτρων. The ever-accelerating development of computer learning methods and, at the same time, the need of the medical and pharmaceutical sector for a better understanding of biological processes has brought to the foreground the interdisciplinary field of bioinformatics. The systematic search for the set of interactions of small and large molecules inside the cell, which is the building block of every living organism, can contribute dramatically to a better understanding of its organization and behavior and in this way offer new information to the efforts for treating and preventing diseases through the efficient and rapid creation of drugs. The most important interactions that take place inside a cell are those between proteins, which perform one of the most complex roles, transmitting messages, catalyzing reactions, or contributing to the maintenance of the cell structure. The collection and concentration of the various protein-protein interactions includes different methods from experimental to literature analysis with text-mining. This thesis deals with the creation, training, and evaluation of a predictive model of protein protein interactions using deep learning and specifically using Graph Neural Networks (GNN) which are a particularly good architecture for data with native graph structure. Therefore, the following are examined in detail in this work: a) Finding, analyzing, and processing high quality data of proteomic interactions, b) Creating examples of negative interactions. c) The creation of a fixed length representation of each protein that maintains its structural and physicochemical properties, d) The search of an architecture for the model that generalizes to unknown data, e) And finally the training and evaluation of the model. 2022-11-03T11:21:08Z 2022-11-03T11:21:08Z 2022-11-02 https://hdl.handle.net/10889/23640 el application/pdf application/octet-stream