Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA
Σκοπός της παρούσας διπλωματικής είναι η μελέτη, η ανάλυση και η σύγκριση μεθοδολογιών ανάλυσης γονιδιακής έκφρασης με χρήση τεχνικών αλληλούχησης RNA και η αξιολόγησή τους στην ταυτοποίηση και την ποσοτικοποίηση μη κωδικών μορίων RNA. Τα μη κωδικά μόρια RNA ορίζονται ως ακολουθίες οι οποίες μεταγρ...
Main Author: | |
---|---|
Other Authors: | |
Format: | Thesis |
Language: | Greek |
Published: |
2018
|
Subjects: | |
Online Access: | http://hdl.handle.net/10889/11318 |
id |
nemertes-10889-11318 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μη κωδικά RNA Ταξινόμηση Non coding RNA Classification Technologies Algorithms 572.880 12 |
spellingShingle |
Μη κωδικά RNA Ταξινόμηση Non coding RNA Classification Technologies Algorithms 572.880 12 Λεοντή, Ιάνθη - Αγγελική Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
description |
Σκοπός της παρούσας διπλωματικής είναι η μελέτη, η ανάλυση και η σύγκριση μεθοδολογιών ανάλυσης γονιδιακής έκφρασης με χρήση τεχνικών αλληλούχησης RNA και η αξιολόγησή τους στην ταυτοποίηση και την ποσοτικοποίηση μη κωδικών μορίων RNA.
Τα μη κωδικά μόρια RNA ορίζονται ως ακολουθίες οι οποίες μεταγράφονται από DNA και είναι λειτουργικές σαν RNA σε αντίθεση με τις ακολουθίες mRNA που παράγουν πρωτεΐνες. Τις τελευταίες δύο δεκαετίες η έρευνα στον τομέα των Βιοεπιστημών έχει δείξει ότι στα μη κωδικά μόρια RNA αποδίδονται όλο και περισσότερες σημαντικές ρυθμιστικές λειτουργίες. Για παράδειγμα έχει βρεθεί ότι συμμετέχουν στην ομαλή λειτουργία διαφόρων κυτταρικών διεργασιών αλλά και σε περιπτώσεις ασθενειών όπως ο καρκίνος έχει παρατηρηθεί ότι το προφίλ έκφρασης αυτών των μορίων είναι διαταραγμένο. Συνεπώς, η μελέτη τους και ο αποδοτικός εντοπισμός τους είναι ένα ανοιχτό ερευνητικό ζήτημα Βιοπληροφορικής και αρκετές μέθοδοι Υπολογιστικής Νοημοσύνης μπορούν να εφαρμοστούν.
Από τη δεκαετία του 1990 αναπτύχθηκαν αρκετές νέες μέθοδοι για την αλληλούχηση του DNA όπου εφαρμόζονται μέχρι και σήμερα αποκαλούμενες ως μέθοδοι αλληλουχίας "επόμενης γενιάς" (NGS). Σ’ αυτές βασίζεται τα τελευταία χρόνια η RNA-seq μεθοδολογία ταυτοποίησης RNA, η οποία αντικαθιστά τις μικροσυστοιχίες για τη μελέτη της γονιδιακής έκφρασης επιτρέποντας υψηλής ανάλυσης διερεύνηση όλων των RNAs που υπάρχουν σε ένα δείγμα, χαρακτηρίζοντας τις αλληλουχίες τους και ποσοτικοποιώντας τις αφθονίες τους ταυτόχρονα.
Στα πλαίσια της παρούσας διπλωματικής εργασίας υλοποιήθηκαν οι πιο διαδεδομένες μεθοδολογίες υπολογιστικής ανάλυσης δεδομένων αλληλούχησης ακολουθιών RNA και πραγματοποιήθηκε συγκριτική αξιολόγησή τους με χρήση τριών διαφορετικών συνόλων δεδομένων. Επίσης, υλοποιήθηκε και αξιολογήθηκε μεθοδολογία ανάλυσης ακολουθιών RNA με σκοπό την ταξινόμησή τους στις διάφορες υποκατηγορίες μη κωδικών μορίων RNA.
H RNA-seq είναι η πιο συνηθισμένη μέθοδος μεταγραφωμικής ανάλυσης, αλλά η τεχνολογία και τα εργαλεία συνεχίζουν να εξελίσσονται. Αξίζει να σημειωθεί ότι η συμφωνία μεταξύ των αποτελεσμάτων που λαμβάνονται από τα διαφορετικά εργαλεία εξακολουθεί να μην είναι ικανοποιητική και ότι τα αποτελέσματα επηρεάζονται από τις ρυθμίσεις των παραμέτρων. Τα αποτελέσματα των τεσσάρων, επιλεγμένων στην εργασία, μεθοδολογιών ταξινόμησης ακολουθιών αποδεικνύουν πώς κάποιο μπορεί να ξεχωρίζει για την ταχύτητα του και τα ποσοστά χαρτογραφημένων reads αλλά κάποιο μπορεί να αναγνωρίζει περισσότερα σε μεγαλύτερο χρόνο. |
author2 |
Λυκοθανάσης, Σπυρίδων |
author_facet |
Λυκοθανάσης, Σπυρίδων Λεοντή, Ιάνθη - Αγγελική |
format |
Thesis |
author |
Λεοντή, Ιάνθη - Αγγελική |
author_sort |
Λεοντή, Ιάνθη - Αγγελική |
title |
Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
title_short |
Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
title_full |
Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
title_fullStr |
Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
title_full_unstemmed |
Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA |
title_sort |
σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων rna |
publishDate |
2018 |
url |
http://hdl.handle.net/10889/11318 |
work_keys_str_mv |
AT leontēianthēangelikē schediasmoskaiylopoiēsēeuphyousalgorithmikēstechnikēsgiatēntaxinomēsēmikrōnmēkōdikōnmoriōnrna AT leontēianthēangelikē designandimplementationofintelligentalgorithmictechniquefortheclassificationofsmallnoncodingrnamolecules |
_version_ |
1771297221991464961 |
spelling |
nemertes-10889-113182022-09-05T14:07:42Z Σχεδιασμός και υλοποίηση ευφυούς αλγοριθμικής τεχνικής για την ταξινόμηση μικρών μη κωδικών μορίων RNA Design and implementation of intelligent algorithmic technique for the classification of small non-coding RNA molecules Λεοντή, Ιάνθη - Αγγελική Λυκοθανάσης, Σπυρίδων Μακρής, Χρήστος Χατζηλυγερούδης, Ιωάννης Leonti, Ianthi - Aggeliki Μη κωδικά RNA Ταξινόμηση Non coding RNA Classification Technologies Algorithms 572.880 12 Σκοπός της παρούσας διπλωματικής είναι η μελέτη, η ανάλυση και η σύγκριση μεθοδολογιών ανάλυσης γονιδιακής έκφρασης με χρήση τεχνικών αλληλούχησης RNA και η αξιολόγησή τους στην ταυτοποίηση και την ποσοτικοποίηση μη κωδικών μορίων RNA. Τα μη κωδικά μόρια RNA ορίζονται ως ακολουθίες οι οποίες μεταγράφονται από DNA και είναι λειτουργικές σαν RNA σε αντίθεση με τις ακολουθίες mRNA που παράγουν πρωτεΐνες. Τις τελευταίες δύο δεκαετίες η έρευνα στον τομέα των Βιοεπιστημών έχει δείξει ότι στα μη κωδικά μόρια RNA αποδίδονται όλο και περισσότερες σημαντικές ρυθμιστικές λειτουργίες. Για παράδειγμα έχει βρεθεί ότι συμμετέχουν στην ομαλή λειτουργία διαφόρων κυτταρικών διεργασιών αλλά και σε περιπτώσεις ασθενειών όπως ο καρκίνος έχει παρατηρηθεί ότι το προφίλ έκφρασης αυτών των μορίων είναι διαταραγμένο. Συνεπώς, η μελέτη τους και ο αποδοτικός εντοπισμός τους είναι ένα ανοιχτό ερευνητικό ζήτημα Βιοπληροφορικής και αρκετές μέθοδοι Υπολογιστικής Νοημοσύνης μπορούν να εφαρμοστούν. Από τη δεκαετία του 1990 αναπτύχθηκαν αρκετές νέες μέθοδοι για την αλληλούχηση του DNA όπου εφαρμόζονται μέχρι και σήμερα αποκαλούμενες ως μέθοδοι αλληλουχίας "επόμενης γενιάς" (NGS). Σ’ αυτές βασίζεται τα τελευταία χρόνια η RNA-seq μεθοδολογία ταυτοποίησης RNA, η οποία αντικαθιστά τις μικροσυστοιχίες για τη μελέτη της γονιδιακής έκφρασης επιτρέποντας υψηλής ανάλυσης διερεύνηση όλων των RNAs που υπάρχουν σε ένα δείγμα, χαρακτηρίζοντας τις αλληλουχίες τους και ποσοτικοποιώντας τις αφθονίες τους ταυτόχρονα. Στα πλαίσια της παρούσας διπλωματικής εργασίας υλοποιήθηκαν οι πιο διαδεδομένες μεθοδολογίες υπολογιστικής ανάλυσης δεδομένων αλληλούχησης ακολουθιών RNA και πραγματοποιήθηκε συγκριτική αξιολόγησή τους με χρήση τριών διαφορετικών συνόλων δεδομένων. Επίσης, υλοποιήθηκε και αξιολογήθηκε μεθοδολογία ανάλυσης ακολουθιών RNA με σκοπό την ταξινόμησή τους στις διάφορες υποκατηγορίες μη κωδικών μορίων RNA. H RNA-seq είναι η πιο συνηθισμένη μέθοδος μεταγραφωμικής ανάλυσης, αλλά η τεχνολογία και τα εργαλεία συνεχίζουν να εξελίσσονται. Αξίζει να σημειωθεί ότι η συμφωνία μεταξύ των αποτελεσμάτων που λαμβάνονται από τα διαφορετικά εργαλεία εξακολουθεί να μην είναι ικανοποιητική και ότι τα αποτελέσματα επηρεάζονται από τις ρυθμίσεις των παραμέτρων. Τα αποτελέσματα των τεσσάρων, επιλεγμένων στην εργασία, μεθοδολογιών ταξινόμησης ακολουθιών αποδεικνύουν πώς κάποιο μπορεί να ξεχωρίζει για την ταχύτητα του και τα ποσοστά χαρτογραφημένων reads αλλά κάποιο μπορεί να αναγνωρίζει περισσότερα σε μεγαλύτερο χρόνο. The purpose of this diploma thesis is to study, analyze and compare genetic expression analysis methodologies using RNA sequencing techniques and their evaluation in the identification and quantification of non-coding RNAs molecules. Non-coding RNAs molecules are defined as sequences which are transcribed from DNA and are functional as RNA in contrast to protein-producing mRNA sequences. Over the last two decades, research in the field of Life Sciences has shown that non-coding RNA may play more and more regulatory functions. For example, it has been found that they are involved in various cellular processes, and also in cases of diseases, such as cancer, it has been observed that the profile of expression of these molecules is disrupted. Therefore, their study and efficient identification is an open research issue of Bioinformatics and several methods of Computational Intelligence can be applied. Since the 1990s, several new methods have been developed for DNA sequencing, which are so far used as 'Next Generation' (NGS) methods. The RNA identification methodology has been based on RNA-seq which replaces microarrays to study gene expression by allowing high-resolution exploration of all RNAs present in a sample, characterizing their sequences and quantifying their abundances at the same time. In the context of this thesis, they have been performed and evaluated the most widely used methodologies for computational analysis of RNA sequencing using three different data sets. Moreover, methods of analyzing RNA sequences were implemented and evaluated in order to classify them into various subclasses of non-coding RNA molecules. Despite RNA-seq is, nowadays, one of the most common method for transcriptomic analysis technologies and tools are evolving. It is worth to mention that in this thesis the agreement between the results obtained by the different tested tools is still unsatisfactory and that the results are affected strongly by the parameter. Finally, the results of this thesis about the four selected sequencing methodology prove that even if one of them can stand out for its speed and the percentages of mapped reads, an other can recognize more mapped reads but in longer time. 2018-06-08T14:28:15Z 2018-06-08T14:28:15Z 2018-01-29 Thesis http://hdl.handle.net/10889/11318 gr 0 application/pdf |