Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs)
Tα μη κωδικοποιητικά RNAs (non-coding RNAs ή ncRNAs) αποτελούν μόρια RNA, τα οποία δε μεταφράζονται σε πρωτεΐνη. Ενώ κάποτε θεωρούνταν ‘μεταγραφικός θόρυβος’, δηλαδή δεν τους είχε αποδοθεί κάποια χρησιμότητα, πλέον θεωρείται πως διαδραματίζουν σημαντικό ρόλο στη ρύθμιση της γονιδιακής έκφρασης και έ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/25234 |
id |
nemertes-10889-25234 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-252342023-06-30T03:57:26Z Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) Design and implementation of a non-coding RNAs (ncRNAs) database Διαμαντοπούλου, Γεωργία Diamantopoulou, Georgia Βάσεις δεδομένων μη κωδικοποιητικά RNA Μόρια ncRNAs Databases of non-coding RNA ncRNAs Tα μη κωδικοποιητικά RNAs (non-coding RNAs ή ncRNAs) αποτελούν μόρια RNA, τα οποία δε μεταφράζονται σε πρωτεΐνη. Ενώ κάποτε θεωρούνταν ‘μεταγραφικός θόρυβος’, δηλαδή δεν τους είχε αποδοθεί κάποια χρησιμότητα, πλέον θεωρείται πως διαδραματίζουν σημαντικό ρόλο στη ρύθμιση της γονιδιακής έκφρασης και έχουν συγκεντρώσει αρκετή προσοχή για την υποσχόμενη χρήση τους στην ιατρική, συγκεκριμένα στη διάγνωση και θεραπεία νοσημάτων, όπως ο καρκίνος. Έχουν ανακαλυφθεί πολλές κατηγορίες ncRNAs, με πιο παλιά τα rRNAs (ριβοσωμικά RNAs) και τα tRNAs (μεταφορικά RNAs), τα οποία εμπλέκονται στη διαδικασία της μετάφρασης. Η άνθιση των τεχνολογιών του Αλληλούχησης Επόμενης Γενιάς (NGS) (και ιδιαιτέρως της Αλληλούχησης RNA), που επιτρέπει τον εντοπισμό τους παρά το μικρό τους μέγεθος, οδήγησε στην ανακάλυψη αρκετών ακόμα κατηγοριών ncRNAs, όπως τα microRNAs (miRNAs) και τα tRNA-derived fragments (tRFs). Εξαιτίας της ανακάλυψης όλο και περισσότερων μορίων ncRNAs, δημιουργήθηκε η ανάγκη για την οργανωμένη αποθήκευσή τους σε βάσεις δεδομένων. Αυτή τη στιγμή υπάρχουν πολλές διαθέσιμες βάσεις δεδομένων ncRNAs στο διαδίκτυο, άλλες εξειδικευμένες για συγκεκριμένη κατηγορία μορίων (πχ. miRBase για miRNAs) ή για το σύνολό τους (πχ. RFAM). Παράλληλα άρχισαν να αναπτύσσονται όλο και περισσότερα εργαλεία για την ταξινόμηση άγνωστων ή νεοανακαλυφθέντων μορίων ncRNAs στις υποκατηγορίες τους, το καθένα εκμεταλλευόμενο διαφορετική πληροφορία του μορίου (πχ. στοιχεία της δευτεροταγούς δομής) και ακολουθώντας διαφορετικές υπολογιστικές μεθόδους. Ένα από τα προβλήματα των περισσότερων εργαλείων (άρα και των διαδικτυακών βάσεων που τα χρησιμοποιούν για την ταξινόμηση των μορίων) είναι πως τα περισσότερα δεν επιτρέπουν σε μία αλληλουχία που αποτελεί μη κωδικοποιητικό RNA να ανήκει σε περισσότερες από μία υποκατηγορίες ταυτόχρονα, κάτι το οποίο έχει αποδειχθεί ότι συμβαίνει στην πράξη. Επίσης, κάποιες μέθοδοι οι οποίες έχουν σχεδιαστεί για ταξινόμηση πολλών κλάσεων, δεν υποστηρίζουν τον πολλαπλό χαρακτηρισμό. Η πληροφορία για τα μη κωδικοποιητικά μόρια RNA είναι κατακερματισμένη σε διάφορες βάσεις δεδομένων με κάποιες από αυτές να εστιάζουν σε πειραματική και ακολουθιακή πληροφορία ενώ άλλες σε δομικά και λειτουργικά χαρακτηριστικά. Η παρούσα διπλωματική εστιάζει στη δημιουργία μίας βάσης γνώσης, η οποία αποθηκεύει αρκετούς από τους γνωστούς τύπους ncRNAs (rRNAs, snoRNAs, tRNAs, tRFs και miRNAs) μαζί με σημαντικά χαρακτηριστικά τους (πχ. θέση και αλληλουχία) αλλά και πληροφορία που έχει προκύψει με χρήση μεθόδων μηχανικής μάθησης για την ταυτοποίηση και ταξινόμηση μικρών κωδικοποιητικών μορίων RNA. H εξόρυξη των δεδομένων έγινε από διαθέσιμες διαδικτυακές βάσεις (όπως ΜINTbase, tRFdb, κ.ά.) και μετά από προεργασία, ώστε να διαμορφωθούν με κατάλληλο τρόπο, έγινε εισαγωγή τους στη βάση. Επίσης, μέθοδοι μηχανικής μάθησης χρησιμοποιήθηκαν όχι μόνο για την ταξινόμηση των ncRNAs σε υποκατηγορίες αλλά και για την πρόβλεψη των γονιδίων-στόχων των ώριμων miRNA. Τέλος, έγινε μελέτη της κατανομής των τιμών διαφόρων χαρακτηριστικών των αλληλουχιών των μορίων που περιλαμβάνονται στη βάση, έτσι ώστε να διερευνηθεί η διαχωριστική τους ικανότητα μεταξύ των κατηγοριών ncRNAs. 2023-06-29T05:30:41Z 2023-06-29T05:30:41Z 2023-03-10 https://hdl.handle.net/10889/25234 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Βάσεις δεδομένων μη κωδικοποιητικά RNA Μόρια ncRNAs Databases of non-coding RNA ncRNAs |
spellingShingle |
Βάσεις δεδομένων μη κωδικοποιητικά RNA Μόρια ncRNAs Databases of non-coding RNA ncRNAs Διαμαντοπούλου, Γεωργία Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
description |
Tα μη κωδικοποιητικά RNAs (non-coding RNAs ή ncRNAs) αποτελούν μόρια RNA, τα οποία δε μεταφράζονται σε πρωτεΐνη. Ενώ κάποτε θεωρούνταν ‘μεταγραφικός θόρυβος’, δηλαδή δεν τους είχε αποδοθεί κάποια χρησιμότητα, πλέον θεωρείται πως διαδραματίζουν σημαντικό ρόλο στη ρύθμιση της γονιδιακής έκφρασης και έχουν συγκεντρώσει αρκετή προσοχή για την υποσχόμενη χρήση τους στην ιατρική, συγκεκριμένα στη διάγνωση και θεραπεία νοσημάτων, όπως ο καρκίνος. Έχουν ανακαλυφθεί πολλές κατηγορίες ncRNAs, με πιο παλιά τα rRNAs (ριβοσωμικά RNAs) και τα tRNAs (μεταφορικά RNAs), τα οποία εμπλέκονται στη διαδικασία της μετάφρασης. Η άνθιση των τεχνολογιών του Αλληλούχησης Επόμενης Γενιάς (NGS) (και ιδιαιτέρως της Αλληλούχησης RNA), που επιτρέπει τον εντοπισμό τους παρά το μικρό τους μέγεθος, οδήγησε στην ανακάλυψη αρκετών ακόμα κατηγοριών ncRNAs, όπως τα microRNAs (miRNAs) και τα tRNA-derived fragments (tRFs).
Εξαιτίας της ανακάλυψης όλο και περισσότερων μορίων ncRNAs, δημιουργήθηκε η ανάγκη για την οργανωμένη αποθήκευσή τους σε βάσεις δεδομένων. Αυτή τη στιγμή υπάρχουν πολλές διαθέσιμες βάσεις δεδομένων ncRNAs στο διαδίκτυο, άλλες εξειδικευμένες για συγκεκριμένη κατηγορία μορίων (πχ. miRBase για miRNAs) ή για το σύνολό τους (πχ. RFAM).
Παράλληλα άρχισαν να αναπτύσσονται όλο και περισσότερα εργαλεία για την ταξινόμηση άγνωστων ή νεοανακαλυφθέντων μορίων ncRNAs στις υποκατηγορίες τους, το καθένα εκμεταλλευόμενο διαφορετική πληροφορία του μορίου (πχ. στοιχεία της δευτεροταγούς δομής) και ακολουθώντας διαφορετικές υπολογιστικές μεθόδους.
Ένα από τα προβλήματα των περισσότερων εργαλείων (άρα και των διαδικτυακών βάσεων που τα χρησιμοποιούν για την ταξινόμηση των μορίων) είναι πως τα περισσότερα δεν επιτρέπουν σε μία αλληλουχία που αποτελεί μη κωδικοποιητικό RNA να ανήκει σε περισσότερες από μία υποκατηγορίες ταυτόχρονα, κάτι το οποίο έχει αποδειχθεί ότι συμβαίνει στην πράξη. Επίσης, κάποιες μέθοδοι οι οποίες έχουν σχεδιαστεί για ταξινόμηση πολλών κλάσεων, δεν υποστηρίζουν τον πολλαπλό χαρακτηρισμό. Η πληροφορία για τα μη κωδικοποιητικά μόρια RNA είναι κατακερματισμένη σε διάφορες βάσεις δεδομένων με κάποιες από αυτές να εστιάζουν σε πειραματική και ακολουθιακή πληροφορία ενώ άλλες σε δομικά και λειτουργικά χαρακτηριστικά.
Η παρούσα διπλωματική εστιάζει στη δημιουργία μίας βάσης γνώσης, η οποία αποθηκεύει αρκετούς από τους γνωστούς τύπους ncRNAs (rRNAs, snoRNAs, tRNAs, tRFs και miRNAs) μαζί με σημαντικά χαρακτηριστικά τους (πχ. θέση και αλληλουχία) αλλά και πληροφορία που έχει προκύψει με χρήση μεθόδων μηχανικής μάθησης για την ταυτοποίηση και ταξινόμηση μικρών κωδικοποιητικών μορίων RNA. H εξόρυξη των δεδομένων έγινε από διαθέσιμες διαδικτυακές βάσεις (όπως ΜINTbase, tRFdb, κ.ά.) και μετά από προεργασία, ώστε να διαμορφωθούν με κατάλληλο τρόπο, έγινε εισαγωγή τους στη βάση. Επίσης, μέθοδοι μηχανικής μάθησης χρησιμοποιήθηκαν όχι μόνο για την ταξινόμηση των ncRNAs σε υποκατηγορίες αλλά και για την πρόβλεψη των γονιδίων-στόχων των ώριμων miRNA. Τέλος, έγινε μελέτη της κατανομής των τιμών διαφόρων χαρακτηριστικών των αλληλουχιών των μορίων που περιλαμβάνονται στη βάση, έτσι ώστε να διερευνηθεί η διαχωριστική τους ικανότητα μεταξύ των κατηγοριών ncRNAs. |
author2 |
Diamantopoulou, Georgia |
author_facet |
Diamantopoulou, Georgia Διαμαντοπούλου, Γεωργία |
author |
Διαμαντοπούλου, Γεωργία |
author_sort |
Διαμαντοπούλου, Γεωργία |
title |
Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
title_short |
Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
title_full |
Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
title_fullStr |
Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
title_full_unstemmed |
Σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων RNA (ncRNAs) |
title_sort |
σχεδιασμός και υλοποίηση βάσης δεδομένων μη κωδικοποιητικών μορίων rna (ncrnas) |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/25234 |
work_keys_str_mv |
AT diamantopoulougeōrgia schediasmoskaiylopoiēsēbasēsdedomenōnmēkōdikopoiētikōnmoriōnrnancrnas AT diamantopoulougeōrgia designandimplementationofanoncodingrnasncrnasdatabase |
_version_ |
1771297267244859392 |