Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα

Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα...

Full description

Bibliographic Details
Main Author: Κορνιαχτός, Αναστάσιος
Other Authors: Korniachtos, Anastasios
Language:Greek
Published: 2023
Subjects:
Online Access:https://hdl.handle.net/10889/24640
id nemertes-10889-24640
record_format dspace
spelling nemertes-10889-246402023-03-04T04:38:12Z Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα Recent imputation methods for single-cell RNA-seq data Κορνιαχτός, Αναστάσιος Korniachtos, Anastasios Καταλογισμός Σύγκριση μεθόδων καταλογισμού Ταξινόμηση Αλληλούχιση RNA μεμονωμένου κυττάρου Μηχανική μάθηση Imputation Performance comparison of imputation methods in classification Classification Single cell RNA sequencing (scRNA-seq) Machine learning SVM classifier(rbf) SGD classifier(linear SVM) Nearest centroid classifier Naive Bayes classifier (Bernoulli) Decision tree classifier (CART) DrImpute scImpute I-Impute McImpute ENHANCE Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα δεδομένων με διαφορετικά πλήθη γονιδίων, κυττάρων(δειγμάτων), κυτταρικών υποπληθυσμών(κλάσεων) τα οποία προέκυψαν από διαφορετικά πρωτόκολλα αλληλούχισης, διαφορετικούς οργανισμούς, διαφορετικούς ιστούς και διαφορετικές παθολογικές καταστάσεις. Έτσι συγκρίνεται η απόδοση της ταξινόμησης μεταξύ των καταλογισμένων από κάθε μέθοδο καταλογισμού συνόλων δεδομένων και των αρχικών συνόλων δεδομένων με χρήση των μετρικών accuracy, recall, specificity, f1 score και precision με χρήση boxplots και πινάκων σύγκρισης. Οι μεταβολές μεταξύ των προ καταλογισμού και μετά καταλογισμού μετρικών αναλύονται ανά μοντέλο ταξινόμησης ως προς όλες τις μεθόδους καταλογισμού αλλά και ανά μέθοδο καταλογισμού ως προς όλα τα μοντέλα ταξινόμησης. Ο καταλογισμός είναι η διαδικασία συμπλήρωσης των χαμένων τιμών που προκύπτουν από αδυναμίες αποδοτικής πραγματοποίησης των στόχων του κάθε βήματος της αλληλούχισης αλλά και λόγο της στοχαστικής έκφρασης των γονιδίων και της αποικοδόμησης των μορίων mRNA. The purpose of the thesis is to test the effects of five imputation methods (DrImpute, scImpute, I-Impute, McImpute and ENHANCE) in classification with SVM, SGD, Nearest Centroid, Naïve Bayes and Decision Tree models in 26 scRNA-seq (single-cell RNA-seq) datasets with different number of genes, cells(samples) and cellular subpopulations (classes) which resulted from different sequencing protocols, different organisms, different tissues and different pathological conditions. Thus the classification performance is compared between the imputed(by the 5 methods) and the original datasets using 5 classification metrics(accuracy, recall, specificity, f1 score , precision) with use of boxplots and comparison tables. The changes between pre imputation and post imputation metrics are analyzed by classification model in terms of all imputation methods and by imputation method across all classification models. Imputation is the process of filling in the missing values that occur due to weaknesses of every step of scRNA sequencing but also due to the stochastic expression of genes and degradation of mRNA molecules. 2023-03-02T11:29:48Z 2023-03-02T11:29:48Z 2023-02-01 https://hdl.handle.net/10889/24640 el Attribution-NonCommercial-ShareAlike 3.0 United States http://creativecommons.org/licenses/by-nc-sa/3.0/us/ application/octet-stream application/octet-stream application/pdf
institution UPatras
collection Nemertes
language Greek
topic Καταλογισμός
Σύγκριση μεθόδων καταλογισμού
Ταξινόμηση
Αλληλούχιση RNA μεμονωμένου κυττάρου
Μηχανική μάθηση
Imputation
Performance comparison of imputation methods in classification
Classification
Single cell RNA sequencing (scRNA-seq)
Machine learning
SVM classifier(rbf)
SGD classifier(linear SVM)
Nearest centroid classifier
Naive Bayes classifier (Bernoulli)
Decision tree classifier (CART)
DrImpute
scImpute
I-Impute
McImpute
ENHANCE
spellingShingle Καταλογισμός
Σύγκριση μεθόδων καταλογισμού
Ταξινόμηση
Αλληλούχιση RNA μεμονωμένου κυττάρου
Μηχανική μάθηση
Imputation
Performance comparison of imputation methods in classification
Classification
Single cell RNA sequencing (scRNA-seq)
Machine learning
SVM classifier(rbf)
SGD classifier(linear SVM)
Nearest centroid classifier
Naive Bayes classifier (Bernoulli)
Decision tree classifier (CART)
DrImpute
scImpute
I-Impute
McImpute
ENHANCE
Κορνιαχτός, Αναστάσιος
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
description Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα δεδομένων με διαφορετικά πλήθη γονιδίων, κυττάρων(δειγμάτων), κυτταρικών υποπληθυσμών(κλάσεων) τα οποία προέκυψαν από διαφορετικά πρωτόκολλα αλληλούχισης, διαφορετικούς οργανισμούς, διαφορετικούς ιστούς και διαφορετικές παθολογικές καταστάσεις. Έτσι συγκρίνεται η απόδοση της ταξινόμησης μεταξύ των καταλογισμένων από κάθε μέθοδο καταλογισμού συνόλων δεδομένων και των αρχικών συνόλων δεδομένων με χρήση των μετρικών accuracy, recall, specificity, f1 score και precision με χρήση boxplots και πινάκων σύγκρισης. Οι μεταβολές μεταξύ των προ καταλογισμού και μετά καταλογισμού μετρικών αναλύονται ανά μοντέλο ταξινόμησης ως προς όλες τις μεθόδους καταλογισμού αλλά και ανά μέθοδο καταλογισμού ως προς όλα τα μοντέλα ταξινόμησης. Ο καταλογισμός είναι η διαδικασία συμπλήρωσης των χαμένων τιμών που προκύπτουν από αδυναμίες αποδοτικής πραγματοποίησης των στόχων του κάθε βήματος της αλληλούχισης αλλά και λόγο της στοχαστικής έκφρασης των γονιδίων και της αποικοδόμησης των μορίων mRNA.
author2 Korniachtos, Anastasios
author_facet Korniachtos, Anastasios
Κορνιαχτός, Αναστάσιος
author Κορνιαχτός, Αναστάσιος
author_sort Κορνιαχτός, Αναστάσιος
title Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
title_short Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
title_full Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
title_fullStr Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
title_full_unstemmed Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
title_sort πρόσφατες μέθοδοι imputation για single-cell rna-seq δεδομένα
publishDate 2023
url https://hdl.handle.net/10889/24640
work_keys_str_mv AT korniachtosanastasios prosphatesmethodoiimputationgiasinglecellrnaseqdedomena
AT korniachtosanastasios recentimputationmethodsforsinglecellrnaseqdata
_version_ 1771297326057390080