Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττά...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14102 |
id |
nemertes-10889-14102 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-141022022-09-05T06:58:42Z Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest Classification gene expressions from data sinle-cell RNA-seq by random forest method Ζωγράφος, Ζήσιμος Zografos, Zisimos Μεταγραφική αλληλούχιση scRNA-seq SIMLR RAFSIL Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττάρων και συνεπώς η λήψη επακριβών ομοιοτήτων κυττάρου-κυττάρου από τα δεδομένα scRNA-seq είναι ένα κρίσιμο βήμα σε πολλές μελέτες. Ενώ γίνονται ταχείες εξελίξεις στην ανάπτυξη εργαλείων για την ανάλυση δεδομένων scRNA-seq, υπάρχουν λίγες προσεγγίσεις που αντιμετωπίζουν ρητά αυτή την προσπάθεια. Επιπλέον, η αφθονία και ο τύπος θορύβου που υπάρχουν στα σύνολα δεδομένων scRNA-seq υποδηλώνουν ότι η εφαρμογή των γενικών μεθόδων ή των μεθόδων που αναπτύσσονται για τα μαζικά δεδομένα RNA-seq είναι πιθανώς μη βέλτιστη. Στην παρούσα εργασία, παρουσιάζεται το RAFSIL, μια προσέγγιση βασισμένη στον αλγόριθμο Random Forest με την οποία γίνεται η εκμάθηση των ομοιοτήτων μεταξύ κυττάρων από τα δεδομένα scRNA-seq. Το RAFSIL εφαρμόζει μια διαδικασία σε δύο βήματα, όπου η κατασκευή χαρακτηριστικών που είναι προσαρμοσμένη στα δεδομένα scRNA-seq ακολουθείται από την εκμάθηση ομοιότητας. Επιπλέον, παρουσιάζεται το SIMLR, μια προσέγγιση που βασίζεται στην πολλαπλή μάθηση του πυρήνα που μαθαίνει απευθείας τις ομοιότητες μεταξύ των μεμονωμένων κυττάρων, ενώ πραγματοποιείται μια σύγκριση των παραπάνω μεθόδων, η οποία τελικά οδηγεί στο συμπέρασμα ότι η μέθοδος RAFSIL έχει καλύτερα αποτελέσματα. Transcriptional sequencing applied to individual cells (scRNA-seq) is increasingly being tested in many biological and biomedical research fields. Scientific objectives often revolve around the discovery or characterization of cell types or subtypes, and therefore obtaining accurate cell-cell similarities from scRNA-seq data is a critical step in many studies. While rapid developments are taking place in the development of tools for scRNA-seq data analysis, there are few approaches that explicitly address this effort. In addition, the abundance and type of noise in scRNA-seq data sets suggest that the application of general methods or methods developed for mass RNA-seq data is probably not optimal. In this paper, RAFSIL is presented, an approach based on the Random Forest algorithm used to learn similarities between cells from scRNA-seq data. RAFSIL implements a two-step process where the construction of features adapted to scRNA-seq data is followed by similarity learning. In addition, SIMLR is presented, an approach based on multiple core learning that directly learns the similarities between individual cells, while comparing the above methods, which ultimately leads to the conclusion that the RAFSIL method has better results. 2020-10-21T14:31:16Z 2020-10-21T14:31:16Z 2020-07-27 http://hdl.handle.net/10889/14102 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μεταγραφική αλληλούχιση scRNA-seq SIMLR RAFSIL |
spellingShingle |
Μεταγραφική αλληλούχιση scRNA-seq SIMLR RAFSIL Ζωγράφος, Ζήσιμος Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
description |
Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττάρων και συνεπώς η λήψη επακριβών ομοιοτήτων κυττάρου-κυττάρου από τα δεδομένα scRNA-seq είναι ένα κρίσιμο βήμα σε πολλές μελέτες. Ενώ γίνονται ταχείες εξελίξεις στην ανάπτυξη εργαλείων για την ανάλυση δεδομένων scRNA-seq, υπάρχουν λίγες προσεγγίσεις που αντιμετωπίζουν ρητά αυτή την προσπάθεια. Επιπλέον, η αφθονία και ο τύπος θορύβου που υπάρχουν στα σύνολα δεδομένων scRNA-seq υποδηλώνουν ότι η εφαρμογή των γενικών μεθόδων ή των μεθόδων που αναπτύσσονται για τα μαζικά δεδομένα RNA-seq είναι πιθανώς μη βέλτιστη. Στην παρούσα εργασία, παρουσιάζεται το RAFSIL, μια προσέγγιση βασισμένη στον αλγόριθμο Random Forest με την οποία γίνεται η εκμάθηση των ομοιοτήτων μεταξύ κυττάρων από τα δεδομένα scRNA-seq. Το RAFSIL εφαρμόζει μια διαδικασία σε δύο βήματα, όπου η κατασκευή χαρακτηριστικών που είναι προσαρμοσμένη στα δεδομένα scRNA-seq ακολουθείται από την εκμάθηση ομοιότητας. Επιπλέον, παρουσιάζεται το SIMLR, μια προσέγγιση που βασίζεται στην πολλαπλή μάθηση του πυρήνα που μαθαίνει απευθείας τις ομοιότητες μεταξύ των μεμονωμένων κυττάρων,
ενώ πραγματοποιείται μια σύγκριση των παραπάνω μεθόδων, η οποία τελικά οδηγεί στο συμπέρασμα ότι η μέθοδος RAFSIL έχει καλύτερα αποτελέσματα. |
author2 |
Zografos, Zisimos |
author_facet |
Zografos, Zisimos Ζωγράφος, Ζήσιμος |
author |
Ζωγράφος, Ζήσιμος |
author_sort |
Ζωγράφος, Ζήσιμος |
title |
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
title_short |
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
title_full |
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
title_fullStr |
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
title_full_unstemmed |
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest |
title_sort |
ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell rna-seq με τη μέθοδο random forest |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/14102 |
work_keys_str_mv |
AT zōgraphoszēsimos taxinomēsēgonidiakōnekphraseōnapodedomenasinglecellrnaseqmetēmethodorandomforest AT zōgraphoszēsimos classificationgeneexpressionsfromdatasinlecellrnaseqbyrandomforestmethod |
_version_ |
1771297166791278592 |