Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών

Το πρόβλημα της ευθυγράμμισης βιολογικών ακολουθιών, δηλαδή πρωτεϊνών και γονιδιακών ακολουθιών, είναι από τα πιο απαιτητικά στην επίλυση και ταυτόχρονα πιο εφαρμόσιμα προβλήματα που σχετίζονται με την επιστήμη της βιοπληροφορικής. Από την ευθυγράμμιση βιολογικών ακολουθιών προκύπτει ένας σημαντικός...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ντάλλα, Μαρία
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2011
Θέματα:
Διαθέσιμο Online:http://nemertes.lis.upatras.gr/jspui/handle/10889/4676
id nemertes-10889-4676
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Ευθυγράμμιση βιολογικών ακολουθιών
Μετάλλαξη
Alignment of biological sequences
Mutation
BLAST
FASTA
572.802 85
spellingShingle Ευθυγράμμιση βιολογικών ακολουθιών
Μετάλλαξη
Alignment of biological sequences
Mutation
BLAST
FASTA
572.802 85
Ντάλλα, Μαρία
Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
description Το πρόβλημα της ευθυγράμμισης βιολογικών ακολουθιών, δηλαδή πρωτεϊνών και γονιδιακών ακολουθιών, είναι από τα πιο απαιτητικά στην επίλυση και ταυτόχρονα πιο εφαρμόσιμα προβλήματα που σχετίζονται με την επιστήμη της βιοπληροφορικής. Από την ευθυγράμμιση βιολογικών ακολουθιών προκύπτει ένας σημαντικός όγκος πληροφορίας που δίνει απαντήσεις σε εξελικτικά ερωτήματα αλλά, κυρίως, βρίσκει εφαρμογή σε πληθώρα τομέων, όπως η διάγνωση και η θεραπεία ασθενειών. Πρόκειται για ένα θέμα που τράβηξε την προσοχή της παγκόσμιας κοινότητας της πληροφορικής μόλις στο δεύτερο μισό του περασμένου αιώνα, επομένως είναι ένα πεδίο με αρκετό χώρο για έρευνα. Στην παρούσα εργασία, αφού δοθεί το απαραίτητο βιολογικό υπόβαθρο, παρουσιάζονται αρχικά οι βασικότεροι αλγόριθμοι που έχουν παρουσιαστεί μέχρι τώρα ως προτάσεις για την εκτέλεση ευθυγραμμίσεων, εξηγούνται οι βασικές δομικές και λειτουργικές διαφορές τους και δίνεται μια πρώτη εκτίμηση της αποτελεσματικότητάς τους, όπως αυτή αντλείται από τη βιβλιογραφία. Στη συνέχεια, το ενδιαφέρον επικεντρώνεται στον αλγόριθμο τοπικής ευθυγράμμισης BLAST. Αναλύεται η λειτουργία του βήμα προς βήμα, παρουσιάζονται οι κυριότερες εκδόσεις του, οι είσοδοι και οι έξοδοί του καθώς και το μαθηματικό υπόβαθρο στο οποίο βασίζεται η υλοποίησή του. Στόχος του πειραματικού τμήματος της εργασίας είναι να εξετάσει κατά πόσο ο BLAST επιτυγχάνει να ταυτοποιήσει, και με τι σφάλμα, μια μεταλλαγμένη ακολουθία, τόσο ως προς το γονίδιο από το οποίο προέρχεται όσο και ως προς το είδος της και τις πιθανές της συνέπειες στον οργανισμό στον οποίο εκφράζεται. Με βάση το γονίδιο BRCA1 του Homo Sapiens, παράγεται μια σειρά μεταλλάξεων, οι οποίες μεταφράζονται. Το σύνολο των παραγομένων βιολογικών ακολουθιών, νουκλεοτιδιακών και αμινοξεϊκών, τίθεται προς αναζήτηση με χρήση του BLAST σε κατάλληλες βάσεις δεδομένων, προκειμένου να ελεγχθεί η ευαισθησία του σε μεταλλάξεις διαφορετικού τύπου και έκτασης. Αποδεικνύεται ότι παρότι ο BLAST επιτυγχάνει με πολύ μικρό σφάλμα την ταυτοποίηση του γονιδίου, ακόμα και σε περιπτώσεις έντονης μετάλλαξης της αρχικής ακολουθίας, ωστόσο η κατανομή των αποτελεσμάτων είναι πολύ πιο ασαφής ως προς την ταυτοποίηση του είδους της μετάλλαξης.
author2 Δερματάς, Ευάγγελος
author_facet Δερματάς, Ευάγγελος
Ντάλλα, Μαρία
format Thesis
author Ντάλλα, Μαρία
author_sort Ντάλλα, Μαρία
title Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
title_short Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
title_full Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
title_fullStr Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
title_full_unstemmed Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
title_sort εφαρμογή του αλγορίθμου blast στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών
publishDate 2011
url http://nemertes.lis.upatras.gr/jspui/handle/10889/4676
work_keys_str_mv AT ntallamaria epharmogētoualgorithmoublaststēnanagnōrisēmetallaxeōngonidiakōnakolouthiōn
AT ntallamaria applicationoftheblastalgorithmintherecognitionofmutationsinbiologicalsequences
_version_ 1771297127117357056
spelling nemertes-10889-46762022-09-05T04:45:08Z Εφαρμογή του αλγορίθμου BLAST στην αναγνώριση μεταλλάξεων γονιδιακών ακολουθιών Application of the BLAST algorithm in the recognition of mutations in biological sequences Ντάλλα, Μαρία Δερματάς, Ευάγγελος Σγάρμπας, Κυριάκος Ntalla, Maria Ευθυγράμμιση βιολογικών ακολουθιών Μετάλλαξη Alignment of biological sequences Mutation BLAST FASTA 572.802 85 Το πρόβλημα της ευθυγράμμισης βιολογικών ακολουθιών, δηλαδή πρωτεϊνών και γονιδιακών ακολουθιών, είναι από τα πιο απαιτητικά στην επίλυση και ταυτόχρονα πιο εφαρμόσιμα προβλήματα που σχετίζονται με την επιστήμη της βιοπληροφορικής. Από την ευθυγράμμιση βιολογικών ακολουθιών προκύπτει ένας σημαντικός όγκος πληροφορίας που δίνει απαντήσεις σε εξελικτικά ερωτήματα αλλά, κυρίως, βρίσκει εφαρμογή σε πληθώρα τομέων, όπως η διάγνωση και η θεραπεία ασθενειών. Πρόκειται για ένα θέμα που τράβηξε την προσοχή της παγκόσμιας κοινότητας της πληροφορικής μόλις στο δεύτερο μισό του περασμένου αιώνα, επομένως είναι ένα πεδίο με αρκετό χώρο για έρευνα. Στην παρούσα εργασία, αφού δοθεί το απαραίτητο βιολογικό υπόβαθρο, παρουσιάζονται αρχικά οι βασικότεροι αλγόριθμοι που έχουν παρουσιαστεί μέχρι τώρα ως προτάσεις για την εκτέλεση ευθυγραμμίσεων, εξηγούνται οι βασικές δομικές και λειτουργικές διαφορές τους και δίνεται μια πρώτη εκτίμηση της αποτελεσματικότητάς τους, όπως αυτή αντλείται από τη βιβλιογραφία. Στη συνέχεια, το ενδιαφέρον επικεντρώνεται στον αλγόριθμο τοπικής ευθυγράμμισης BLAST. Αναλύεται η λειτουργία του βήμα προς βήμα, παρουσιάζονται οι κυριότερες εκδόσεις του, οι είσοδοι και οι έξοδοί του καθώς και το μαθηματικό υπόβαθρο στο οποίο βασίζεται η υλοποίησή του. Στόχος του πειραματικού τμήματος της εργασίας είναι να εξετάσει κατά πόσο ο BLAST επιτυγχάνει να ταυτοποιήσει, και με τι σφάλμα, μια μεταλλαγμένη ακολουθία, τόσο ως προς το γονίδιο από το οποίο προέρχεται όσο και ως προς το είδος της και τις πιθανές της συνέπειες στον οργανισμό στον οποίο εκφράζεται. Με βάση το γονίδιο BRCA1 του Homo Sapiens, παράγεται μια σειρά μεταλλάξεων, οι οποίες μεταφράζονται. Το σύνολο των παραγομένων βιολογικών ακολουθιών, νουκλεοτιδιακών και αμινοξεϊκών, τίθεται προς αναζήτηση με χρήση του BLAST σε κατάλληλες βάσεις δεδομένων, προκειμένου να ελεγχθεί η ευαισθησία του σε μεταλλάξεις διαφορετικού τύπου και έκτασης. Αποδεικνύεται ότι παρότι ο BLAST επιτυγχάνει με πολύ μικρό σφάλμα την ταυτοποίηση του γονιδίου, ακόμα και σε περιπτώσεις έντονης μετάλλαξης της αρχικής ακολουθίας, ωστόσο η κατανομή των αποτελεσμάτων είναι πολύ πιο ασαφής ως προς την ταυτοποίηση του είδους της μετάλλαξης. The goal of the present thesis is the examination of the sensitivity of the local alignment algorithm BLAST, on a set of mutated biological sequences. The algorithm's sensitivity is to be measured with regard to three basic criteria: - identification of the relation to the original gene - identification of the mutation type - prediction of possible influence of the organism in question In the first, theoretical part of the thesis, a general biological background is offered, followed by a sufficient presentation on both the history and the latest achievements in the field of sequence alignment. The main topic introduced is the structure and functionality of BLAST, together with its principal editions, its inputs and outputs and the mathematical foundation standing below it. In the experimental part of the thesis, the BRCA1 gene is picked out of the Homo Sapiens Genome; its sequence suffers a number of mutations of different type and extent. Each produced mutation is translated into the corresponding protein. The entire set of biological sequences produced is going through a BLAST Search to test the sensitivity of the algorithm according to the mutation under examination. Analyzing the results, it is safe to claim that BLAST succeeds to recognize the gene from which the mutated sequences are produced, including extremely low error in the process. On the other hand, the identification of the mutation type is certainly of significantly lower sensitivity. Thus the main proposal extracted is the implementation of a patterns recognition system, which will integrate artificial intelligence methods to connect patterns encountered within the input sequence, with diseases reported in the appropriate documentation. 2011-10-03T11:05:01Z 2011-10-03T11:05:01Z 2011-06-29 2011-10-03T11:05:01Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/4676 gr 0 application/pdf