Εξαγωγή δικτύων αλληλεπιδράσεων για την εξομοίωση βιολογικών διεργασιών σε χαμηλό και υψηλό επίπεδο μέσω ευφυών αλγορίθμων

Η μελέτη των βιολογικών συστημάτων στα διαφορετικά επίπεδα οργάνωσης του κυττάρου είναι ένας τομέας που αναδύεται ταχύτατα στην περιοχή της υπολογιστικής βιολογίας. Η πλειοψηφία των ερευνών σε αυτό τον τομέα έχει επικεντρωθεί στον διαχωρισμό των γονιδίων σε βιολογικά μονοπάτια ή διεργασίες. Το επόμε...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Δημητρακόπουλος, Χρήστος
Άλλοι συγγραφείς: Λυκοθανάσης, Σπυρίδων
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2013
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/6532
Περιγραφή
Περίληψη:Η μελέτη των βιολογικών συστημάτων στα διαφορετικά επίπεδα οργάνωσης του κυττάρου είναι ένας τομέας που αναδύεται ταχύτατα στην περιοχή της υπολογιστικής βιολογίας. Η πλειοψηφία των ερευνών σε αυτό τον τομέα έχει επικεντρωθεί στον διαχωρισμό των γονιδίων σε βιολογικά μονοπάτια ή διεργασίες. Το επόμενο βήμα στην κατανόηση του κυττάρου στο συστημικό του επίπεδο είναι ο καθορισμός του τρόπου με τον οποίο οι συγκεκριμένες κυτταρικές διεργασίες λειτουργούν μαζί για να επιτελέσουν τις κυτταρικές λειτουργίες. Βασικός σκοπός της παρούσας διπλωματικής εργασίας είναι η πρόβλεψη αλληλεπιδράσεων διαφόρων ειδών οι οποίες λαμβάνουν μέρος στα διαφορετικά επίπεδα του κυττάρου καθώς και η διερεύνηση του τρόπου με τον οποίο αυτές οι αλληλεπιδράσεις συνεργάζονται μεταξύ τους έτσι ώστε να επιτελέσουν τις κυτταρικές λειτουργίες. Στο χαμηλότερο επίπεδο του κυττάρου υπάρχουν οι φυσικές αλληλεπιδράσεις οι οποίες ισοδυναμούν με σύνδεση των πρωτεϊνών (ή μιας πρωτεΐνης και ενός DNA μορίου) στον 3-διάστατο χώρο. Η σύνδεση αυτή μπορεί να έχει διάφορα αποτελέσματα, όπως η μεταφορά ενός βιοσήματος ή η δημιουργία ενός νέου βιομορίου. Σε ένα ανώτερο επίπεδο από τις φυσικές αλληλεπιδράσεις, πραγματοποιούνται οι λειτουργικές αλληλεπιδράσεις οι οποίες μπορούν σε γενικές γραμμές να κατηγοριοποιηθούν σε σειριακές λειτουργικές αλληλεπιδράσεις (δίκτυα ρυθμιστικών αλληλεπιδράσεων), παράλληλες λειτουργικές αλληλεπιδράσεις όπως για παράδειγμα η συνθετική θνησιμότητα (γενετικές αλληλεπιδράσεις) και συνεργατικές λειτουργικές αλληλεπιδράσεις, όπως για παράδειγμα τα πρωτεϊνικά σύμπλοκα. Οι βιολογικές διεργασίες οι οποίες δραστηριοποιούνται στο ανώτατο επίπεδο του κυττάρου είναι στην πραγματικότητα ομάδες πρωτεϊνών και γονιδίων τα οποία λειτουργούν συνεργατικά. Οι αλληλεπιδράσεις μεταξύ των βιολογικών διεργασιών είναι οι υψηλότερου κυτταρικού επιπέδου αλληλεπιδράσεις τις οποίες θα μπορούσαμε να ανιχνεύσουμε. Η ανίχνευση των παραπάνω διαφορετικών ειδών αλληλεπιδράσεων καθώς και η εννοιολογική σύνδεσή τους αποτελεί το αντικείμενο μελέτης της παρούσας διπλωματικής εργασίας. Η αναγκαία πληροφορία για να οδηγηθούμε στην πρόβλεψη αλληλεπιδράσεων του ανώτερου επιπέδου του κυττάρου είναι οι χαμηλού επιπέδου (physical) πρωτεϊνικές αλληλεπιδράσεις. Πολλές υπολογιστικές μέθοδοι έχουν εφαρμοστεί μέχρι στιγμής στο πρόβλημα της πρόβλεψης πρωτεϊνικών αλληλεπιδράσεων, οι οποίες όμως αποτυγχάνουν στην ταυτόχρονη επίτευξη καλής απόδοσης και ερμηνευσιμότητας. Στα πλαίσια της διπλωματικής εργασίας αναλύεται το πρόβλημα της πρόβλεψης πρωτεϊνικών αλληλεπιδράσεων. Περιγράφονται οι πιο πρόσφατες πειραματικές και υπολογιστικές μέθοδοι για την ανίχνευση τους. Αναλύονται οι διαφορές τους, τα πλεονεκτήματα και τα μειονεκτήματά τους και επιπλέον γίνεται μία προσπάθεια καταγραφής των στοιχείων που τις περιορίζουν και προτείνονται τρόποι για την μελλοντική εξέλιξη και βελτίωσή τους. Στην συνέχεια μελετάται ο τρόπος με τον οποίο η τοπολογία των δικτύων πρωτεϊνικών αλληλεπιδράσεων επηρεάζει τις λειτουργικές αλληλεπιδράσεις που εμφανίζονται στο εσωτερικό του κυττάρου, όπως για παράδειγμα τις ρυθμιστικές (regulatory) και τις επιστατικές (genetic) αλληλεπιδράσεις. Δημιουργείται ένα σταθμισμένο δίκτυο το οποίο περιέχει πληροφορία για τις αλληλεπιδράσεις μεταξύ των πρωτεϊνών στο φυσικό επίπεδο (physical interactions). Η εκμετάλλευση της τοπολογίας του δικτύου φυσικών αλληλεπιδράσεων γίνεται μέσω τεχνικών διάχυσης πυρήνων (kernel diffusion). Τροποποιώντας τον βαθμό της διάχυσης (degree of diffusion), δημιουργούνται τα προφιλ διάχυσης (diffusion profiles). Στην συνέχεια, αυτά τα προφίλ χρησιμοποιούνται προκειμένου να χαρακτηρίσουν τις τοπολογίες που συνδέουν τις πρωτεΐνες πάνω στο δίκτυο φυσικών αλληλεπιδράσεων. Επίσης τα προφίλ διάχυσης, αποδεικνύονται εξαιρετικά χρήσιμα εργαλεία στην βελτίωση της απόδοσης των αλγορίθμων πρόβλεψης λειτουργικών αλληλεπιδράσεων. Στην συνέχεια οι πρωτεϊνικές αλληλεπιδράσεις χρησιμοποιούνται εκ νέου προκειμένου να προβλεφθούν εξαρτήσεις σε ένα επίπεδο υψηλότερα των λειτουργικών αλληλεπιδράσεων και συγκεκριμένα μεταξύ βιολογικών διεργασιών όπως αυτές περιγράφονται στην βάση δεδομένων Gene Ontology. Η κλασσική προσέγγιση στην μελέτη πολύπλοκων βιολογικών δικτύων βασίζεται στην ταυτοποίηση αλληλεπιδράσεων μεταξύ εσωτερικών συστατικών μεταβολικών ή σηματιδικών μονοπατιών. Επιπλέον, γνωρίζουμε σήμερα πολύ λίγα πράγματα για τις αλληλεπιδράσεις μεταξύ βιολογικών συστημάτων ανώτερης τάξης, όπως είναι τα βιολογικά μονοπάτια και οι βιολογικές διεργασίες. Στα πλαίσια της διπλωματικής εργασίας προτείνεται μια μεθοδολογία για την εύρεση αλληλεπιδράσεων μεταξύ βιολογικών διεργασιών αναλύοντας σταθμισμένες και μη σταθμισμένες πρωτεϊνικές αλληλεπιδράσεις. Βασική απόρροια της διπλωματικής εργασίας είναι οι αλληλεπιδράσεις μεταξύ βιολογικών διεργασιών που προέκυψαν και μέσω των οποίων δημιουργείται ένα νεο είδος δικτύου, το δίκτυο αλληλεπιδράσεων μεταξύ βιολογικών διεργασιών. Διάφορες βάσεις δεδομένων έχουν σχεδιαστεί για την αποθήκευση πληροφορίας σχετικής με τις πειραματικά και υπολογιστικά ταυτοποιημένες ανθρώπινες πρωτεϊνικές αλληλεπιδράσεις. Ωστόσο, αυτές οι βάσεις δεδομένων περιέχουν πολλές λανθασμένα θετικές αλληλεπιδράσεις, έχουν χαμηλή κάλυψη και μόνο λίγες από αυτές ενσωματώνουν πληροφορία από διάφορες πηγές. Για την αποφυγή των παραπάνω προβλημάτων, έχει σχεδιαστεί η βάση δεδομένων ΗΙΝΤ-ΚΒ (http://150.140.142.24:84) η οποία είναι μία βάση γνώσης που ενσωματώνει δεδομένα από διάφορες πηγές, παρέχει ένα φιλικό περιβάλλον προς τον χρήστη για την ανάκτησή τους, υπολογίζει ένα σύνολο χαρακτηριστικών και ένα σκορ εμπιστοσύνης για κάθε πιθανή πρωτεϊνική αλληλεπίδραση. Το σκορ εμπιστοσύνης είναι βασικό για το φιλτράρισμα των λανθασμένα θετικών αλληλεπιδράσεων οι οποίες είναι παρούσες σε διάφορες υπάρχουσες βάσεις δεδομένων. Για το σκοπό αυτό δημιουργήθηκε μία νέα υβριδική μεθοδολογία μηχανικής μάθησης, η οποία ονομάζεται Μαθηματική Μοντελοποίηση Εξελικτικού Κάλμαν (ΜΜΕΚ) για την επίτευξη μιας ακριβούς και ερμηνεύσιμης διαδικασίας ανάθεσης βαρών στις πρωτεϊνικές αλληλεπιδράσεις. Τα πειραματικά αποτελέσματα καταδεικνύουν ότι η συγκεκριμένη μέθοδος υπερτερεί σε σχέση με τις πιο γνωστές μεθόδους πρόβλεψης πρωτεϊνικών αλληλεπιδράσεων. Τα αποτελέσματα της διπλωματικής εργασίας φιλοδοξείται να συμβάλλουν στην πρόβλεψη νέων πιθανών αλληλεπιδράσεων του χαμηλού και του υψηλού κυτταρικού επιπέδου του ανθρώπινου οργανισμού και του οργανισμού του Ζακχαρομήκυτα (S. cerevisiae). Επιπλέον, μπορούν να χρησιμοποιηθούν για την κατανόηση των ανώτερων επιπέδων οργάνωσης του κυττάρου σαν ένα ενιαίο σύστημα. Τέλος, μία ακόμη σημαντική απόρροια που προκύπτει από την ανάλυση που παρέχεται από την διπλωματική εργασία είναι η ανάγκη επανεξέτασης της state-of-the-art προσεγγίσης της βάσης δεδομένων Gene Ontology για την οργάνωση της βιολογικής γνώσης.