Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest

Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττά...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ζωγράφος, Ζήσιμος
Άλλοι συγγραφείς: Zografos, Zisimos
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14102
id nemertes-10889-14102
record_format dspace
spelling nemertes-10889-141022022-09-05T06:58:42Z Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest Classification gene expressions from data sinle-cell RNA-seq by random forest method Ζωγράφος, Ζήσιμος Zografos, Zisimos Μεταγραφική αλληλούχιση scRNA-seq SIMLR RAFSIL Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττάρων και συνεπώς η λήψη επακριβών ομοιοτήτων κυττάρου-κυττάρου από τα δεδομένα scRNA-seq είναι ένα κρίσιμο βήμα σε πολλές μελέτες. Ενώ γίνονται ταχείες εξελίξεις στην ανάπτυξη εργαλείων για την ανάλυση δεδομένων scRNA-seq, υπάρχουν λίγες προσεγγίσεις που αντιμετωπίζουν ρητά αυτή την προσπάθεια. Επιπλέον, η αφθονία και ο τύπος θορύβου που υπάρχουν στα σύνολα δεδομένων scRNA-seq υποδηλώνουν ότι η εφαρμογή των γενικών μεθόδων ή των μεθόδων που αναπτύσσονται για τα μαζικά δεδομένα RNA-seq είναι πιθανώς μη βέλτιστη. Στην παρούσα εργασία, παρουσιάζεται το RAFSIL, μια προσέγγιση βασισμένη στον αλγόριθμο Random Forest με την οποία γίνεται η εκμάθηση των ομοιοτήτων μεταξύ κυττάρων από τα δεδομένα scRNA-seq. Το RAFSIL εφαρμόζει μια διαδικασία σε δύο βήματα, όπου η κατασκευή χαρακτηριστικών που είναι προσαρμοσμένη στα δεδομένα scRNA-seq ακολουθείται από την εκμάθηση ομοιότητας. Επιπλέον, παρουσιάζεται το SIMLR, μια προσέγγιση που βασίζεται στην πολλαπλή μάθηση του πυρήνα που μαθαίνει απευθείας τις ομοιότητες μεταξύ των μεμονωμένων κυττάρων, ενώ πραγματοποιείται μια σύγκριση των παραπάνω μεθόδων, η οποία τελικά οδηγεί στο συμπέρασμα ότι η μέθοδος RAFSIL έχει καλύτερα αποτελέσματα. Transcriptional sequencing applied to individual cells (scRNA-seq) is increasingly being tested in many biological and biomedical research fields. Scientific objectives often revolve around the discovery or characterization of cell types or subtypes, and therefore obtaining accurate cell-cell similarities from scRNA-seq data is a critical step in many studies. While rapid developments are taking place in the development of tools for scRNA-seq data analysis, there are few approaches that explicitly address this effort. In addition, the abundance and type of noise in scRNA-seq data sets suggest that the application of general methods or methods developed for mass RNA-seq data is probably not optimal. In this paper, RAFSIL is presented, an approach based on the Random Forest algorithm used to learn similarities between cells from scRNA-seq data. RAFSIL implements a two-step process where the construction of features adapted to scRNA-seq data is followed by similarity learning. In addition, SIMLR is presented, an approach based on multiple core learning that directly learns the similarities between individual cells, while comparing the above methods, which ultimately leads to the conclusion that the RAFSIL method has better results. 2020-10-21T14:31:16Z 2020-10-21T14:31:16Z 2020-07-27 http://hdl.handle.net/10889/14102 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μεταγραφική αλληλούχιση
scRNA-seq
SIMLR
RAFSIL
spellingShingle Μεταγραφική αλληλούχιση
scRNA-seq
SIMLR
RAFSIL
Ζωγράφος, Ζήσιμος
Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
description Η μεταγραφική αλληλούχιση που εφαρμόζεται σε μεμονωμένα κύτταρα (scRNA-seq) γίνεται ολοένα και περισσότερο μια δοκιμή επιλογής σε πολλά πεδία βιολογικής και βιοϊατρικής έρευνας. Οι επιστημονικοί στόχοι συχνά περιστρέφονται γύρω από την ανακάλυψη ή τον χαρακτηρισμό των τύπων ή των υπο-τύπων των κυττάρων και συνεπώς η λήψη επακριβών ομοιοτήτων κυττάρου-κυττάρου από τα δεδομένα scRNA-seq είναι ένα κρίσιμο βήμα σε πολλές μελέτες. Ενώ γίνονται ταχείες εξελίξεις στην ανάπτυξη εργαλείων για την ανάλυση δεδομένων scRNA-seq, υπάρχουν λίγες προσεγγίσεις που αντιμετωπίζουν ρητά αυτή την προσπάθεια. Επιπλέον, η αφθονία και ο τύπος θορύβου που υπάρχουν στα σύνολα δεδομένων scRNA-seq υποδηλώνουν ότι η εφαρμογή των γενικών μεθόδων ή των μεθόδων που αναπτύσσονται για τα μαζικά δεδομένα RNA-seq είναι πιθανώς μη βέλτιστη. Στην παρούσα εργασία, παρουσιάζεται το RAFSIL, μια προσέγγιση βασισμένη στον αλγόριθμο Random Forest με την οποία γίνεται η εκμάθηση των ομοιοτήτων μεταξύ κυττάρων από τα δεδομένα scRNA-seq. Το RAFSIL εφαρμόζει μια διαδικασία σε δύο βήματα, όπου η κατασκευή χαρακτηριστικών που είναι προσαρμοσμένη στα δεδομένα scRNA-seq ακολουθείται από την εκμάθηση ομοιότητας. Επιπλέον, παρουσιάζεται το SIMLR, μια προσέγγιση που βασίζεται στην πολλαπλή μάθηση του πυρήνα που μαθαίνει απευθείας τις ομοιότητες μεταξύ των μεμονωμένων κυττάρων, ενώ πραγματοποιείται μια σύγκριση των παραπάνω μεθόδων, η οποία τελικά οδηγεί στο συμπέρασμα ότι η μέθοδος RAFSIL έχει καλύτερα αποτελέσματα.
author2 Zografos, Zisimos
author_facet Zografos, Zisimos
Ζωγράφος, Ζήσιμος
author Ζωγράφος, Ζήσιμος
author_sort Ζωγράφος, Ζήσιμος
title Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
title_short Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
title_full Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
title_fullStr Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
title_full_unstemmed Ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell RNA-seq με τη μέθοδο Random Forest
title_sort ταξινόμηση γονιδιακών εκφράσεων από δεδομένα single-cell rna-seq με τη μέθοδο random forest
publishDate 2020
url http://hdl.handle.net/10889/14102
work_keys_str_mv AT zōgraphoszēsimos taxinomēsēgonidiakōnekphraseōnapodedomenasinglecellrnaseqmetēmethodorandomforest
AT zōgraphoszēsimos classificationgeneexpressionsfromdatasinlecellrnaseqbyrandomforestmethod
_version_ 1771297166791278592