Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα α...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13703 |
id |
nemertes-10889-13703 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-137032022-09-05T11:17:30Z Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης Prediction of protein-protein interactions via matrix completion and deep neural networks Χαμαμτζόγλου, Μηνάς Chamamtzoglou, Minas Πρωτεΐνες Αλληλεπιδράσεις πρωτεϊνών Συμπλήρωση μητρώου Παραγοντοποίηση μητρώου Τανυστική αποδόμηση Μηχανική μάθηση Νευρωνικά δίκτυα Proteins Neural networks Machine learning Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα αντικείμενο μεγάλης σημασίας για την κατανόηση της λειτουργίας των πρωτεϊνών και έναν από τους βασικούς στόχους της συστημικής βιολογίας (systems biology ). Αφού πρώτα παρουσιαστεί το θεωρητικό βιολογικό υπόβαθρο της εργασίας, γίνεται αναφορά στους τρόπους εντοπισμού των εν λόγω αλληλεπιδράσεων, τόσο πειραματικά όσο και υπολογιστικά, ενώ το κεφάλαιο ολοκληρώνεται με την επιγραμματική αναφορά στις μεγαλύτερες βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων. Το δεύτερο μέρος της εργασίας αφορά την εισαγωγή στις βασικές έννοιες της μηχανικής μάθησης. Με τον όρο μηχανική μάθηση αναφερόμαστε σε μεθόδους ανάλυσης και επεξεργασίας δεδομένων με σκοπό την αυτοματοποίηση μοντέλων μηχανών και υπολογιστικών συστημάτων. Δίνονται ορισμοί και αναπτύσσονται έννοιες όπως τα νευρωνικά δίκτυα που θα αναπτυχθούν λεπτομερώς και στην υλοποίηση της εργασίας. Έπειτα από την ολοκλήρωση του θεωρητικού πλαισίου της εργασίας, υλοποιείται η προσέγγιση της παρούσας διπλωματικής. Ξεκινάει με τον ορισμό του προβλήματος και την ανάλυση της εξαγωγής δεδομένων αλληλεπιδράσεων πρωτεϊνών. Έπειτα από τη δημιουργία του συνόλου δεδομένων, παρουσιάζονται τεχνικές συμπλήρωσης μητρώων (matrix completion), μαθηματικές μέθοδοι συμπλήρωσης μη-υπαρχόντων τιμών στο σύνολο των δεδομένων, με σκοπό την μείωση της διαστασιμότητας του προβλήματος και την βελτίωση της απόδοσης των αλγορίθμων μας. Παρουσιάζεται μια τεχνική παραγοντοποίησης μητρώου μέσω stochastic gradient descent (matrix factorization with SGD), καθώς και μια τεχνική τανυστικής αποδόμησης (tensor decomposition). Έπειτα από την επεξεργασία των δεδομένων ακολουθεί η ανάπτυξη νευρωνικών δικτύων για τον εντοπισμό αλληλεπιδράσεων. Παρουσιάζονται λεπτομερώς οι αρχιτεκτονικές που χρησιμοποιήθηκαν στα πλαίσια της εργασίας, ενώ συγκρίνεται η απόδοση των εν λόγω δομών με υπάρχοντα μοντέλα. Η εργασία ολοκληρώνεται με την παρουσίαση των μελλοντικών σκέψεων σχετικά με την εξέλιξη των μοντέλων και την βελτίωση των αποτελεσμάτων. - 2020-08-02T10:56:47Z 2020-08-02T10:56:47Z 2020-07-24 http://hdl.handle.net/10889/13703 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Πρωτεΐνες Αλληλεπιδράσεις πρωτεϊνών Συμπλήρωση μητρώου Παραγοντοποίηση μητρώου Τανυστική αποδόμηση Μηχανική μάθηση Νευρωνικά δίκτυα Proteins Neural networks Machine learning |
spellingShingle |
Πρωτεΐνες Αλληλεπιδράσεις πρωτεϊνών Συμπλήρωση μητρώου Παραγοντοποίηση μητρώου Τανυστική αποδόμηση Μηχανική μάθηση Νευρωνικά δίκτυα Proteins Neural networks Machine learning Χαμαμτζόγλου, Μηνάς Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
description |
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η μελέτη και η κατανόηση των πρωτεϊνικών αλληλεπιδράσεων (Protein Protein Interactions - PPIs), καθώς και η δημιουργία μοντέλων μηχανικής μάθησης (machine learning models) για τον εντοπισμό των PPIs. H αλληλεπίδραση μεταξύ πρωτεϊνών αποτελεί ένα αντικείμενο μεγάλης σημασίας για την κατανόηση της λειτουργίας των πρωτεϊνών και έναν από τους βασικούς στόχους της συστημικής βιολογίας (systems biology ). Αφού πρώτα παρουσιαστεί το θεωρητικό βιολογικό υπόβαθρο της εργασίας, γίνεται αναφορά στους τρόπους εντοπισμού των εν λόγω αλληλεπιδράσεων, τόσο πειραματικά όσο και υπολογιστικά, ενώ το κεφάλαιο ολοκληρώνεται με την επιγραμματική αναφορά στις μεγαλύτερες βάσεις δεδομένων πρωτεϊνικών αλληλεπιδράσεων. Το δεύτερο μέρος της εργασίας αφορά την εισαγωγή στις βασικές έννοιες της μηχανικής μάθησης. Με τον όρο μηχανική μάθηση αναφερόμαστε σε μεθόδους ανάλυσης και επεξεργασίας δεδομένων με σκοπό την αυτοματοποίηση μοντέλων μηχανών και υπολογιστικών συστημάτων. Δίνονται ορισμοί και αναπτύσσονται έννοιες όπως τα νευρωνικά δίκτυα που θα αναπτυχθούν λεπτομερώς και στην υλοποίηση της εργασίας. Έπειτα από την ολοκλήρωση του θεωρητικού πλαισίου της εργασίας, υλοποιείται η προσέγγιση της παρούσας διπλωματικής. Ξεκινάει με τον ορισμό του προβλήματος και την ανάλυση της εξαγωγής δεδομένων αλληλεπιδράσεων πρωτεϊνών. Έπειτα από τη δημιουργία του συνόλου δεδομένων, παρουσιάζονται τεχνικές συμπλήρωσης μητρώων (matrix completion), μαθηματικές μέθοδοι συμπλήρωσης μη-υπαρχόντων τιμών στο σύνολο των δεδομένων, με σκοπό την μείωση της διαστασιμότητας του προβλήματος και την βελτίωση της απόδοσης των αλγορίθμων μας. Παρουσιάζεται μια τεχνική παραγοντοποίησης μητρώου μέσω stochastic gradient descent (matrix factorization with SGD), καθώς και μια τεχνική τανυστικής αποδόμησης (tensor decomposition). Έπειτα από την επεξεργασία των δεδομένων ακολουθεί η ανάπτυξη νευρωνικών δικτύων για τον εντοπισμό αλληλεπιδράσεων. Παρουσιάζονται λεπτομερώς οι αρχιτεκτονικές που χρησιμοποιήθηκαν στα πλαίσια της εργασίας, ενώ συγκρίνεται η απόδοση των εν λόγω δομών με υπάρχοντα μοντέλα. Η εργασία ολοκληρώνεται με την παρουσίαση των μελλοντικών σκέψεων σχετικά με την εξέλιξη των μοντέλων και την βελτίωση των αποτελεσμάτων. |
author2 |
Chamamtzoglou, Minas |
author_facet |
Chamamtzoglou, Minas Χαμαμτζόγλου, Μηνάς |
author |
Χαμαμτζόγλου, Μηνάς |
author_sort |
Χαμαμτζόγλου, Μηνάς |
title |
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
title_short |
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
title_full |
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
title_fullStr |
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
title_full_unstemmed |
Εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
title_sort |
εντοπισμός αλληλεπιδράσεων πρωτεϊνών μέσω συμπλήρωσης μητρώων και αλγορίθμων βαθιάς μάθησης |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13703 |
work_keys_str_mv |
AT chamamtzogloumēnas entopismosallēlepidraseōnprōteïnōnmesōsymplērōsēsmētrōōnkaialgorithmōnbathiasmathēsēs AT chamamtzogloumēnas predictionofproteinproteininteractionsviamatrixcompletionanddeepneuralnetworks |
_version_ |
1771297214991171584 |