Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης

Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα α...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Χαμαμτζόγλου, Μηνάς
Άλλοι συγγραφείς: Chamamtzoglou, Minas
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13703
id nemertes-10889-13703
record_format dspace
spelling nemertes-10889-137032022-09-05T11:17:30Z Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης Prediction of protein-protein interactions via matrix completion and deep neural networks Χαμαμτζόγλου, Μηνάς Chamamtzoglou, Minas Πρωτεΐνες Αλληλεπιδράσεις πρωτεϊνών Συμπλήρωση μητρώου Παραγοντοποίηση μητρώου Τανυστική αποδόμηση Μηχανική μάθηση Νευρωνικά δίκτυα Proteins Neural networks Machine learning Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα αντικείμενο μεγάλης σημασίας για την κατανόηση της λειτουργίας των πρωτεϊνών και έναν από τους βασικούς στόχους της συστημικής βιολογίας (systems biology ). Αφού πρώτα παρουσιαστεί το θεωρητικό βιολογικό υπόβαθρο της εργασίας, γίνεται αναφορά στους τρόπους εντοπισμού των εν λόγω αλληλεπιδράσεων, τόσο πειραματικά όσο και υπολογιστικά, ενώ το κεφάλαιο ολοκληρώνεται με την επιγραμματική αναφορά στις μεγαλύτερες βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων. Το δεύτερο μέρος της εργασίας αφορά την εισαγωγή στις βασικές έννοιες της μηχανικής μάθησης. Με τον όρο μηχανική μάθηση αναφερόμαστε σε μεθόδους ανάλυσης και επεξεργασίας δεδομένων με σκοπό την αυτοματοποίηση μοντέλων μηχανών και υπολογιστικών συστημάτων. Δίνονται ορισμοί και αναπτύσσονται έννοιες όπως τα νευρωνικά δίκτυα που θα αναπτυχθούν λεπτομερώς και στην υλοποίηση της εργασίας. Έπειτα από την ολοκλήρωση του θεωρητικού πλαισίου της εργασίας, υλοποιείται η προσέγγιση της παρούσας διπλωματικής. Ξεκινάει με τον ορισμό του προβλήματος και την ανάλυση της εξαγωγής δεδομένων αλληλεπιδράσεων πρωτεϊνών. Έπειτα από τη δημιουργία του συνόλου δεδομένων, παρουσιάζονται τεχνικές συμπλήρωσης μητρώων (matrix completion), μαθηματικές μέθοδοι συμπλήρωσης μη-υπαρχόντων τιμών στο σύνολο των δεδομένων, με σκοπό την μείωση της διαστασιμότητας του προβλήματος και την βελτίωση της απόδοσης των αλγορίθμων μας. Παρουσιάζεται μια τεχνική παραγοντοποίησης μητρώου μέσω stochastic gradient descent (matrix factorization with SGD), καθώς και μια τεχνική τανυστικής αποδόμησης (tensor decomposition). Έπειτα από την επεξεργασία των δεδομένων ακολουθεί η ανάπτυξη νευρωνικών δικτύων για τον εντοπισμό αλληλεπιδράσεων. Παρουσιάζονται λεπτομερώς οι αρχιτεκτονικές που χρησιμοποιήθηκαν στα πλαίσια της εργασίας, ενώ συγκρίνεται η απόδοση των εν λόγω δομών με υπάρχοντα μοντέλα. Η εργασία ολοκληρώνεται με την παρουσίαση των μελλοντικών σκέψεων σχετικά με την εξέλιξη των μοντέλων και την βελτίωση των αποτελεσμάτων. - 2020-08-02T10:56:47Z 2020-08-02T10:56:47Z 2020-07-24 http://hdl.handle.net/10889/13703 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Πρωτεΐνες
Αλληλεπιδράσεις πρωτεϊνών
Συμπλήρωση μητρώου
Παραγοντοποίηση μητρώου
Τανυστική αποδόμηση
Μηχανική μάθηση
Νευρωνικά δίκτυα
Proteins
Neural networks
Machine learning
spellingShingle Πρωτεΐνες
Αλληλεπιδράσεις πρωτεϊνών
Συμπλήρωση μητρώου
Παραγοντοποίηση μητρώου
Τανυστική αποδόμηση
Μηχανική μάθηση
Νευρωνικά δίκτυα
Proteins
Neural networks
Machine learning
Χαμαμτζόγλου, Μηνάς
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
description Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα αντικείμενο μεγάλης σημασίας για την κατανόηση της λειτουργίας των πρωτεϊνών και έναν από τους βασικούς στόχους της συστημικής βιολογίας (systems biology ). Αφού πρώτα παρουσιαστεί το θεωρητικό βιολογικό υπόβαθρο της εργασίας, γίνεται αναφορά στους τρόπους εντοπισμού των εν λόγω αλληλεπιδράσεων, τόσο πειραματικά όσο και υπολογιστικά, ενώ το κεφάλαιο ολοκληρώνεται με την επιγραμματική αναφορά στις μεγαλύτερες βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων. Το δεύτερο μέρος της εργασίας αφορά την εισαγωγή στις βασικές έννοιες της μηχανικής μάθησης. Με τον όρο μηχανική μάθηση αναφερόμαστε σε μεθόδους ανάλυσης και επεξεργασίας δεδομένων με σκοπό την αυτοματοποίηση μοντέλων μηχανών και υπολογιστικών συστημάτων. Δίνονται ορισμοί και αναπτύσσονται έννοιες όπως τα νευρωνικά δίκτυα που θα αναπτυχθούν λεπτομερώς και στην υλοποίηση της εργασίας. Έπειτα από την ολοκλήρωση του θεωρητικού πλαισίου της εργασίας, υλοποιείται η προσέγγιση της παρούσας διπλωματικής. Ξεκινάει με τον ορισμό του προβλήματος και την ανάλυση της εξαγωγής δεδομένων αλληλεπιδράσεων πρωτεϊνών. Έπειτα από τη δημιουργία του συνόλου δεδομένων, παρουσιάζονται τεχνικές συμπλήρωσης μητρώων (matrix completion), μαθηματικές μέθοδοι συμπλήρωσης μη-υπαρχόντων τιμών στο σύνολο των δεδομένων, με σκοπό την μείωση της διαστασιμότητας του προβλήματος και την βελτίωση της απόδοσης των αλγορίθμων μας. Παρουσιάζεται μια τεχνική παραγοντοποίησης μητρώου μέσω stochastic gradient descent (matrix factorization with SGD), καθώς και μια τεχνική τανυστικής αποδόμησης (tensor decomposition). Έπειτα από την επεξεργασία των δεδομένων ακολουθεί η ανάπτυξη νευρωνικών δικτύων για τον εντοπισμό αλληλεπιδράσεων. Παρουσιάζονται λεπτομερώς οι αρχιτεκτονικές που χρησιμοποιήθηκαν στα πλαίσια της εργασίας, ενώ συγκρίνεται η απόδοση των εν λόγω δομών με υπάρχοντα μοντέλα. Η εργασία ολοκληρώνεται με την παρουσίαση των μελλοντικών σκέψεων σχετικά με την εξέλιξη των μοντέλων και την βελτίωση των αποτελεσμάτων.
author2 Chamamtzoglou, Minas
author_facet Chamamtzoglou, Minas
Χαμαμτζόγλου, Μηνάς
author Χαμαμτζόγλου, Μηνάς
author_sort Χαμαμτζόγλου, Μηνάς
title Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
title_short Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
title_full Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
title_fullStr Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
title_full_unstemmed Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
title_sort εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
publishDate 2020
url http://hdl.handle.net/10889/13703
work_keys_str_mv AT chamamtzogloumēnas entopismosallēlepidraseōnprōteïnōnmesōsymplērōsēsmētrōōnkaialgorithmōnbathiasmathēsēs
AT chamamtzogloumēnas predictionofproteinproteininteractionsviamatrixcompletionanddeepneuralnetworks
_version_ 1771297214991171584