Πρόβλεψη microRNA γονιδίων : σχεδιασμός και ανάπτυξη ολοκληρωμένου δικτυακού εργαλείου εξαγωγής χαρακτηριστικών και ταξινόμησης με χρήση καινοτόμων τεχνικών υπολογιστικής νοημοσύνης

Η ανακάλυψη των microRNA γονιδίων το 1993 έφερε επανάσταση στα όσα γνωρίζαμε από το κεντρικό δόγμα της Βιολογίας για τη σύνθεση των πρωτεϊνών και τη ρύθμιση της πρωτεϊνικής έκφρασης. Αυτό γιατί τα microRNA γονίδια δεν κωδικοποιούν κάποια πρωτεΐνη αλλά αντί αυτού παράγουν μικρά μόρια μεγέθους περίπου...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κλεφτογιάννης, Δημήτριος
Άλλοι συγγραφείς: Τσακαλίδης, Αθανάσιος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2012
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/5008
Περιγραφή
Περίληψη:Η ανακάλυψη των microRNA γονιδίων το 1993 έφερε επανάσταση στα όσα γνωρίζαμε από το κεντρικό δόγμα της Βιολογίας για τη σύνθεση των πρωτεϊνών και τη ρύθμιση της πρωτεϊνικής έκφρασης. Αυτό γιατί τα microRNA γονίδια δεν κωδικοποιούν κάποια πρωτεΐνη αλλά αντί αυτού παράγουν μικρά μόρια μεγέθους περίπου 22 νουκλεοτιδιών. Τα μόρια αυτά αλληλεπιδρούν με το mRNA και συγκεκριμένα βρίσκουν στόχους στις 3 UTR περιοχές άλλων γονιδίων και αλληλεπιδρούν με βάση την αρχή της συμπληρωματικότητας Watson-Crick. Αποτέλεσμα αυτής της πρόσδεσης είναι η καταστολή της πρωτεϊνικής έκφρασης του γονιδίου στόχου μέσω αναστολής της μετάφρασης ή μέσω της υποβάθμισης του mRNA. Μετά την ανακάλυψη των microRNA και του τρόπου αλληλεπίδρασης τους ήταν φυσικό να ακολουθήσουν εκτεταμένες έρευνες για τις κυτταρικές διεργασίες τις οποίες ρυθμίζουν αλλά και σε ποιών γονίδιων τη ρύθμιση λαμβάνουν μέρος. Ως αποτέλεσμα προέκυψε ότι σε πολλές γνωστές ασθένειες παρουσιάζεται άμεση συσχέτιση με ρύθμιση από microRNA. Τέτοια περίπτωση αποτελεί και η ασθένεια του καρκίνου η οποία σε συνδυασμό με την «λεπτή» ρύθμιση που προκαλούν τα microRNA δίνει ελπίδες για νέες μοριακές θεραπείες. Αυτά είναι μερικά παραδείγματα από τα οποία μπορούμε να καταλάβουμε τη μεγάλη σημασία των microRNA και την ανάγκη για αποδοτική πρόβλεψη τους. Εξαιτίας του μικρού τους μεγέθους αλλά και του μικρού τους ποσοστού σε σχέση με το μέγεθος του γονιδιώματος (περίπου 3%) ο πειραματικός τους εντοπισμός χαρακτηρίζεται εξαιρετικά δύσκολος. Για το λόγο αυτό έχουν επιστρατευτεί αρκετές μέθοδοι Υπολογιστικής Νοημοσύνης και Αλγόριθμοι οι οποίοι μπορούν να «ξεχωρίσουν» τα πραγματικά γονίδια από τα ψεύτικα γονίδια δημιουργώντας έτσι μοντέλα πρόβλεψης. Μέχρι στιγμής έχουν χρησιμοποιηθεί σαν μέθοδοι ταξινόμησης, Support Vector Machine, δίκτυα Bayes και άλλες πιθανοτικές μέθοδοι όπως τα Hidden Markov μοντέλα .Όλες οι μέθοδοι αυτού του είδους βασίζονται στον υπολογισμό αρκετών χαρακτηριστικών για τα microRNA που σχετίζονται με το ακολουθιακό περιεχόμενο, με τη δομή τους στο χώρο αλλά και με θερμοδυναμικά στοιχεία των μορίων. Σε μεγάλο βαθμό η αποδοτικότητα πρόβλεψης βασίζεται στην επιλογή των πιο αντιπροσωπευτικών χαρακτηριστικών και στη βελτιστοποίηση των παραμέτρων της υπολογιστικής μεθόδου που χρησιμοποιείται χωρίς μέχρι τώρα να έχει βρεθεί μια αξιόπιστη λύση. Στην παρούσα διπλωματική εργασία αρχικά προτείναμε μια νέα υβριδική μεθοδολογία για ταυτόχρονη ταξινόμηση microRNA γονιδίων, εξαγωγή χαρακτηριστικών και υπολογισμό παραμέτρων. Η προτεινόμενη μεθοδολογία χρησιμοποιεί τις καινοτόμες τεχνικές του Εξελικτικού Προγραμματισμού και συγκεκριμένα τους Γενετικούς Αλγορίθμους για την εξαγωγή χαρακτηριστικών και βελτιστοποίηση παραμέτρων καθώς και Support Vector Machine για ταξινόμηση. Απώτερος στόχος της παρούσας εργασίας ήταν να αναπτυχθεί μια ολοκληρωμένη διαδικτυακή πλατφόρμα η οποία επιτρέπει αρχικά υπολογισμό χαρακτηριστικών για τις γονιδιακές ακολουθίες που θα εισάγει ο χρήστης και κατά δεύτερον δίνει την πρόβλεψη του ταξινομητή για το αν είναι ή όχι microRNA γονίδια μέσω ενός φιλικού περιβάλλοντος. Επιπλέον, ενσωματώθηκαν τα περισσότερα microRNA χαρακτηριστικά που έχουν προταθεί στη βιβλιογραφία και η αποδοτικότητα πρόβλεψης του ταξινομητή βελτιώθηκε μέσω της προτεινόμενης υβριδικής μεθόδου. Ενσωματώσαμε διάφορα πακέτα για τον υπολογισμό των χαρακτηριστικών όπως το Vienna RNA Package και το UnaFold και αυτό το κομμάτι της εργασίας σχετίζεται με την έρευνα για τη θερμοδυναμική και φυσικοχημική συμπεριφορά των μικρών RNA μορίων. Καινοτόμο στοιχείο αποτελεί το γεγονός ότι ο υπολογισμός των χαρακτηριστικών γίνεται με τέτοιο τρόπο ώστε να ευνοείται στη συνέχεια η εφαρμογή μεθόδων Υπολογιστικής Νοημοσύνης. Επιπλέον στο σύστημα ενσωματώσαμε βάση δεδομένων η οποία αποθηκεύει τις επεξεργασμένες ακολουθίες και τα υπολογισμένα χαρακτηριστικά δίνοντας ώθηση για την κατασκευή νέων συνόλων δεδομένων. Τέλος αυτή η δυνατότητα ανάκτησης πληροφορίας κάνει το σύστημα μας μια ολοκληρωμένη πλατφόρμα μελέτης μικρών RNA μορίων και πρόβλεψης microRNA γονιδίων.