Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq
Καθώς η επίδραση της τεχνολογίας αυξάνεται σε όλους τους κλάδους, αυξάνονται ταυτόχρονα και οι απαιτήσεις. Μέσω του τομέα της βιοπληροφορικής έχει δοθεί η δυνατότητα στους επιστήμονες να εξερευνήσουν, να πειραματιστούν και να ανακαλύψουν σε μεγαλύτερο και βαθύτερο εύρος τις λειτουργίες των ζωντανών...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15044 |
id |
nemertes-10889-15044 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Βιοπληροφορική Δίκτυα Γονιδίων Γονιδιακά Ρυθμιστικά δίκτυα scRNA-seq Δημιουργία GRN Bioinformatics Gene Network Gene Regulatory Network - GRN scRNA-seq GRN Inference Evaluation |
spellingShingle |
Βιοπληροφορική Δίκτυα Γονιδίων Γονιδιακά Ρυθμιστικά δίκτυα scRNA-seq Δημιουργία GRN Bioinformatics Gene Network Gene Regulatory Network - GRN scRNA-seq GRN Inference Evaluation Κουμαδωράκης, Δημήτριος Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
description |
Καθώς η επίδραση της τεχνολογίας αυξάνεται σε όλους τους κλάδους, αυξάνονται ταυτόχρονα και οι απαιτήσεις. Μέσω του τομέα της βιοπληροφορικής έχει δοθεί η δυνατότητα στους επιστήμονες να εξερευνήσουν, να πειραματιστούν και να ανακαλύψουν σε μεγαλύτερο και βαθύτερο εύρος τις λειτουργίες των ζωντανών οργανισμών και την αντιμετώπιση ασθενειών. Πάνω στο μοριακό επίπεδο, ο τομέας έχει συμβάλλει στη μαζική ανάλυση συνόλων κυττάρων αλλά και των εσωτερικών τους διεργασιών. Για την ανάλυση του γενετικού κώδικα και συγκεκριμένα του μεταφορικού RNA που μεταφέρει τη πληροφορία για τη δημιουργία κάποιας πρωτεΐνης, δημιουργήθηκαν οι αλληλουχίες RNA μεμονωμένων κυττάρων οι οποίες παρουσιάζουν την ακριβή έκφραση των γονιδίων ώστε να παραχθεί συγκεκριμένη ποσότητα πρωτεϊνών που απαιτούνται για την εκτέλεση κάποιας κυτταρικής διαδικασίας.
Ένα σημαντικό εργαλείο των τελευταίων ετών που έχει συμβάλλει στην ανάλυση των γονιδίων από δεδομένα scRNA είναι τα γονιδιακά ρυθμιστικά δίκτυα (GRN), δηλαδή δίκτυα γονιδίων που παρουσιάζουν τις επιδράσεις που ασκούνται στα γονίδια, μεταβάλλοντας τα επίπεδα έκφρασής τους. Τα γονίδια παίζουν πολύ σημαντικό ρόλο για τις διαδικασίες που λαμβάνουν μέρος στο εσωτερικό του κυττάρου με τις οποίες να μπορούν να επηρεάσουν τόσο το ίδιο αλλά και ολόκληρο τον οργανισμό σε συγκεκριμένες περιπτώσεις. Καθώς όμως σε κάθε διαδικασία δεν συμμετέχουν όλα τα γονίδια, είναι σημαντικό να βρεθούν ποια είναι ενεργοποιημένα αλλά και ποιοι παράγοντες ελέγχουν την ενεργοποίησή τους. Ο σκοπός ενός GRN είναι η απεικόνιση των ρυθμιστικών σχέσεων των γονιδίων ώστε να βρεθούν οι ρυθμιστές τους καθώς και ποια γονίδια ενεργοποιούνται σε κάθε διαδικασία.
Τα τελευταία χρόνια, έχει δημιουργηθεί πληθώρα στοχαστικών αλγορίθμων που κατασκευάζουν τέτοιου είδους δίκτυα με σκοπό την πρόβλεψη των ρυθμιστικών σχέσεων πάνω σε ένα σύνολο δεδομένων γονιδιακής έκφρασης. Η παρούσα διπλωματική εστιάζει στην ανάλυση οκτώ αλγορίθμων κατασκευής GRN από δεδομένα scRNA αλλά και στην αξιολόγηση αυτών ώστε να φανεί η ικανότητα που έχουν να προβλέπουν σωστά τα αποτελέσματα. Οι αλγόριθμοι που αναλύονται είναι οι εξής: GENIE3, GRISLI, GRNBOOST2, GRNVBEM, LEAP, PPCOR, SCODE, SINGE. Ορισμένοι εξ αυτών απαιτούν σαν είσοδο ένα σύνολο χρόνων που να δείχνει το στάδιο που βρίσκεται το κάθε κύτταρο. Καθώς στα δεδομένα scRNA είναι δύσκολο να βρεθούν αυτοί οι χρόνοι, έχουν αναπτυχθεί εργαλεία τα οποία κατασκευάζουν ψευδοχρόνους, δηλαδή πειραματικές τιμές που παρουσιάζουν το στάδιο του κυττάρου με βάση τον υπόλοιπο πληθυσμό κυττάρων του δείγματος. Για τους οκτώ παραπάνω αλγορίθμους δόθηκαν ως είσοδοι δύο μητρώα διαφορετικού μεγέθους με σκοπό την καλύτερη σύγκρισή τους. Οι ψευδοχρόνοι βρέθηκαν μέσω ενός εργαλείου, του TSCAN.
Προκειμένου να αξιολογηθούν τα αποτελέσματα των αλγορίθμων έπρεπε να βρεθούν δύο λίστες αναφοράς (gold standard) που θα παρείχαν τις σωστές ρυθμιστικές σχέσεις των δεδομένων εισόδου. Η σύγκριση μεταξύ των αποτελεσμάτων των αλγορίθμων με τα δεδομένα αναφοράς έγινε κάνοντας χρήση του κώδικα αξιολόγησης από το Dream 5, με την αξιολόγηση να γίνεται μέσω των μετρικών AUROC και AUPR. Μέσω της συγκεκριμένης εργασίας θα παρουσιαστούν και θα αναλυθούν τα αποτελέσματα των παραπάνω αλγορίθμων φανερώνοντας τη σημαντικότητα ενός τέτοιου αλγορίθμου αλλά και τις δυσκολίες που υπάρχουν ώστε να βελτιστοποιηθεί το τελικό αποτέλεσμα. |
author2 |
Koumadorakis, Dimitris |
author_facet |
Koumadorakis, Dimitris Κουμαδωράκης, Δημήτριος |
author |
Κουμαδωράκης, Δημήτριος |
author_sort |
Κουμαδωράκης, Δημήτριος |
title |
Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
title_short |
Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
title_full |
Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
title_fullStr |
Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
title_full_unstemmed |
Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq |
title_sort |
κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scrna-seq |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/15044 |
work_keys_str_mv |
AT koumadōrakēsdēmētrios kataskeuēkaiaxiologēsēgonidiakōnrythmistikōndiktyōnapodedomenascrnaseq AT koumadōrakēsdēmētrios constructionandevaluationofgeneregulatorynetworksfromscrnaseqdata |
_version_ |
1771297317764202496 |
spelling |
nemertes-10889-150442022-09-05T20:37:38Z Κατασκευή και αξιολόγηση γονιδιακών ρυθμιστικών δικτύων από δεδομένα scRNA-seq Construction and evaluation of gene regulatory networks from scRNA-seq data Κουμαδωράκης, Δημήτριος Koumadorakis, Dimitris Βιοπληροφορική Δίκτυα Γονιδίων Γονιδιακά Ρυθμιστικά δίκτυα scRNA-seq Δημιουργία GRN Bioinformatics Gene Network Gene Regulatory Network - GRN scRNA-seq GRN Inference Evaluation Καθώς η επίδραση της τεχνολογίας αυξάνεται σε όλους τους κλάδους, αυξάνονται ταυτόχρονα και οι απαιτήσεις. Μέσω του τομέα της βιοπληροφορικής έχει δοθεί η δυνατότητα στους επιστήμονες να εξερευνήσουν, να πειραματιστούν και να ανακαλύψουν σε μεγαλύτερο και βαθύτερο εύρος τις λειτουργίες των ζωντανών οργανισμών και την αντιμετώπιση ασθενειών. Πάνω στο μοριακό επίπεδο, ο τομέας έχει συμβάλλει στη μαζική ανάλυση συνόλων κυττάρων αλλά και των εσωτερικών τους διεργασιών. Για την ανάλυση του γενετικού κώδικα και συγκεκριμένα του μεταφορικού RNA που μεταφέρει τη πληροφορία για τη δημιουργία κάποιας πρωτεΐνης, δημιουργήθηκαν οι αλληλουχίες RNA μεμονωμένων κυττάρων οι οποίες παρουσιάζουν την ακριβή έκφραση των γονιδίων ώστε να παραχθεί συγκεκριμένη ποσότητα πρωτεϊνών που απαιτούνται για την εκτέλεση κάποιας κυτταρικής διαδικασίας. Ένα σημαντικό εργαλείο των τελευταίων ετών που έχει συμβάλλει στην ανάλυση των γονιδίων από δεδομένα scRNA είναι τα γονιδιακά ρυθμιστικά δίκτυα (GRN), δηλαδή δίκτυα γονιδίων που παρουσιάζουν τις επιδράσεις που ασκούνται στα γονίδια, μεταβάλλοντας τα επίπεδα έκφρασής τους. Τα γονίδια παίζουν πολύ σημαντικό ρόλο για τις διαδικασίες που λαμβάνουν μέρος στο εσωτερικό του κυττάρου με τις οποίες να μπορούν να επηρεάσουν τόσο το ίδιο αλλά και ολόκληρο τον οργανισμό σε συγκεκριμένες περιπτώσεις. Καθώς όμως σε κάθε διαδικασία δεν συμμετέχουν όλα τα γονίδια, είναι σημαντικό να βρεθούν ποια είναι ενεργοποιημένα αλλά και ποιοι παράγοντες ελέγχουν την ενεργοποίησή τους. Ο σκοπός ενός GRN είναι η απεικόνιση των ρυθμιστικών σχέσεων των γονιδίων ώστε να βρεθούν οι ρυθμιστές τους καθώς και ποια γονίδια ενεργοποιούνται σε κάθε διαδικασία. Τα τελευταία χρόνια, έχει δημιουργηθεί πληθώρα στοχαστικών αλγορίθμων που κατασκευάζουν τέτοιου είδους δίκτυα με σκοπό την πρόβλεψη των ρυθμιστικών σχέσεων πάνω σε ένα σύνολο δεδομένων γονιδιακής έκφρασης. Η παρούσα διπλωματική εστιάζει στην ανάλυση οκτώ αλγορίθμων κατασκευής GRN από δεδομένα scRNA αλλά και στην αξιολόγηση αυτών ώστε να φανεί η ικανότητα που έχουν να προβλέπουν σωστά τα αποτελέσματα. Οι αλγόριθμοι που αναλύονται είναι οι εξής: GENIE3, GRISLI, GRNBOOST2, GRNVBEM, LEAP, PPCOR, SCODE, SINGE. Ορισμένοι εξ αυτών απαιτούν σαν είσοδο ένα σύνολο χρόνων που να δείχνει το στάδιο που βρίσκεται το κάθε κύτταρο. Καθώς στα δεδομένα scRNA είναι δύσκολο να βρεθούν αυτοί οι χρόνοι, έχουν αναπτυχθεί εργαλεία τα οποία κατασκευάζουν ψευδοχρόνους, δηλαδή πειραματικές τιμές που παρουσιάζουν το στάδιο του κυττάρου με βάση τον υπόλοιπο πληθυσμό κυττάρων του δείγματος. Για τους οκτώ παραπάνω αλγορίθμους δόθηκαν ως είσοδοι δύο μητρώα διαφορετικού μεγέθους με σκοπό την καλύτερη σύγκρισή τους. Οι ψευδοχρόνοι βρέθηκαν μέσω ενός εργαλείου, του TSCAN. Προκειμένου να αξιολογηθούν τα αποτελέσματα των αλγορίθμων έπρεπε να βρεθούν δύο λίστες αναφοράς (gold standard) που θα παρείχαν τις σωστές ρυθμιστικές σχέσεις των δεδομένων εισόδου. Η σύγκριση μεταξύ των αποτελεσμάτων των αλγορίθμων με τα δεδομένα αναφοράς έγινε κάνοντας χρήση του κώδικα αξιολόγησης από το Dream 5, με την αξιολόγηση να γίνεται μέσω των μετρικών AUROC και AUPR. Μέσω της συγκεκριμένης εργασίας θα παρουσιαστούν και θα αναλυθούν τα αποτελέσματα των παραπάνω αλγορίθμων φανερώνοντας τη σημαντικότητα ενός τέτοιου αλγορίθμου αλλά και τις δυσκολίες που υπάρχουν ώστε να βελτιστοποιηθεί το τελικό αποτέλεσμα. As the impact of technology increases in all industries, so do the demands. Through the field of bioinformatics, scientists have been given the opportunity to explore, experiment and discover on a larger and deeper scale the functions of living organisms and the treatment of diseases. At the molecular level, the field has contributed to the mass analysis of cell sets and their internal processes. For the analysis of the genetic code and specifically of the transport RNA that carries the information for the creation of a protein, the RNA sequences of individual cells were created which show the exact expression of the genes to produce a certain amount of proteins required to perform a cell process. An important tool in recent years that has contributed to the analysis of genes from scRNA data is the gene regulatory networks (GRNs), ie gene networks that exhibit the effects exerted on genes by altering their expression levels. Genes play a very important role in the processes that take place inside the cell with which they can affect both the body and the whole organism in specific cases. However, as not all genes are involved in every process, it is important to find out which ones are activated, and which factors control their activation. The purpose of a GRN is to visualize the regulatory relationships of genes to find their regulators as well as which genes are activated in each process. In recent years, a variety of stochastic algorithms have been developed that construct such networks in order to predict regulatory relationships on a set of gene expression data. This dissertation focuses on the analysis of eight GRN construction algorithms from scRNA data but also on their evaluation in order to show their ability to correctly predict the results. The algorithms analyzed are as follows: GENIE3, GRISLI, GRNBOOST2, GRNVBEM, LEAP, PPCOR, SCODE, SINGE. Some of them require as input a set of times that indicates the stage of each cell. As these times are difficult to find in scRNA data, tools have been developed that construct pseudo-times, that is, experimental values that show the cell stage based on the rest of the sample cell population. For the above eight algorithms, two registers of different sizes were given as inputs in order to better compare them. The pseudo-times were found through a tool, TSCAN. To evaluate the results of the algorithms, two reference lists (gold standard) had to be found that would provide the correct regulatory relationships of the input data. The comparison between the results of the algorithms and the reference data was done using the evaluation code from Dream 5, with the evaluation being done through the metric AUROC and AUPR. Through this work, the results of the above algorithms will be presented and analyzed, revealing the importance of such an algorithm but also the difficulties that exist to optimize the results. 2021-07-19T06:47:45Z 2021-07-19T06:47:45Z 2021-07-16 http://hdl.handle.net/10889/15044 gr application/pdf |