Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα
Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα...
Main Author: | |
---|---|
Other Authors: | |
Language: | Greek |
Published: |
2023
|
Subjects: | |
Online Access: | https://hdl.handle.net/10889/24640 |
id |
nemertes-10889-24640 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-246402023-03-04T04:38:12Z Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα Recent imputation methods for single-cell RNA-seq data Κορνιαχτός, Αναστάσιος Korniachtos, Anastasios Καταλογισμός Σύγκριση μεθόδων καταλογισμού Ταξινόμηση Αλληλούχιση RNA μεμονωμένου κυττάρου Μηχανική μάθηση Imputation Performance comparison of imputation methods in classification Classification Single cell RNA sequencing (scRNA-seq) Machine learning SVM classifier(rbf) SGD classifier(linear SVM) Nearest centroid classifier Naive Bayes classifier (Bernoulli) Decision tree classifier (CART) DrImpute scImpute I-Impute McImpute ENHANCE Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα δεδομένων με διαφορετικά πλήθη γονιδίων, κυττάρων(δειγμάτων), κυτταρικών υποπληθυσμών(κλάσεων) τα οποία προέκυψαν από διαφορετικά πρωτόκολλα αλληλούχισης, διαφορετικούς οργανισμούς, διαφορετικούς ιστούς και διαφορετικές παθολογικές καταστάσεις. Έτσι συγκρίνεται η απόδοση της ταξινόμησης μεταξύ των καταλογισμένων από κάθε μέθοδο καταλογισμού συνόλων δεδομένων και των αρχικών συνόλων δεδομένων με χρήση των μετρικών accuracy, recall, specificity, f1 score και precision με χρήση boxplots και πινάκων σύγκρισης. Οι μεταβολές μεταξύ των προ καταλογισμού και μετά καταλογισμού μετρικών αναλύονται ανά μοντέλο ταξινόμησης ως προς όλες τις μεθόδους καταλογισμού αλλά και ανά μέθοδο καταλογισμού ως προς όλα τα μοντέλα ταξινόμησης. Ο καταλογισμός είναι η διαδικασία συμπλήρωσης των χαμένων τιμών που προκύπτουν από αδυναμίες αποδοτικής πραγματοποίησης των στόχων του κάθε βήματος της αλληλούχισης αλλά και λόγο της στοχαστικής έκφρασης των γονιδίων και της αποικοδόμησης των μορίων mRNA. The purpose of the thesis is to test the effects of five imputation methods (DrImpute, scImpute, I-Impute, McImpute and ENHANCE) in classification with SVM, SGD, Nearest Centroid, Naïve Bayes and Decision Tree models in 26 scRNA-seq (single-cell RNA-seq) datasets with different number of genes, cells(samples) and cellular subpopulations (classes) which resulted from different sequencing protocols, different organisms, different tissues and different pathological conditions. Thus the classification performance is compared between the imputed(by the 5 methods) and the original datasets using 5 classification metrics(accuracy, recall, specificity, f1 score , precision) with use of boxplots and comparison tables. The changes between pre imputation and post imputation metrics are analyzed by classification model in terms of all imputation methods and by imputation method across all classification models. Imputation is the process of filling in the missing values that occur due to weaknesses of every step of scRNA sequencing but also due to the stochastic expression of genes and degradation of mRNA molecules. 2023-03-02T11:29:48Z 2023-03-02T11:29:48Z 2023-02-01 https://hdl.handle.net/10889/24640 el Attribution-NonCommercial-ShareAlike 3.0 United States http://creativecommons.org/licenses/by-nc-sa/3.0/us/ application/octet-stream application/octet-stream application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Καταλογισμός Σύγκριση μεθόδων καταλογισμού Ταξινόμηση Αλληλούχιση RNA μεμονωμένου κυττάρου Μηχανική μάθηση Imputation Performance comparison of imputation methods in classification Classification Single cell RNA sequencing (scRNA-seq) Machine learning SVM classifier(rbf) SGD classifier(linear SVM) Nearest centroid classifier Naive Bayes classifier (Bernoulli) Decision tree classifier (CART) DrImpute scImpute I-Impute McImpute ENHANCE |
spellingShingle |
Καταλογισμός Σύγκριση μεθόδων καταλογισμού Ταξινόμηση Αλληλούχιση RNA μεμονωμένου κυττάρου Μηχανική μάθηση Imputation Performance comparison of imputation methods in classification Classification Single cell RNA sequencing (scRNA-seq) Machine learning SVM classifier(rbf) SGD classifier(linear SVM) Nearest centroid classifier Naive Bayes classifier (Bernoulli) Decision tree classifier (CART) DrImpute scImpute I-Impute McImpute ENHANCE Κορνιαχτός, Αναστάσιος Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
description |
Σκοπός της διπλωματικής εργασίας είναι να ελέγξει την επίδραση του καταλογισμού
μέσω των μεθόδων DrImpute, scImpute, I-Impute, McImpute και ENHANCE στην
ταξινόμηση με τα μοντέλα SVM, SGD, Nearest Centroid, Naïve Bayes και Decision Trees
σε 26 scRNA-seq(αλληλούχισης RNA μεμονωμένου κυττάρου) σύνολα δεδομένων με
διαφορετικά πλήθη γονιδίων, κυττάρων(δειγμάτων), κυτταρικών
υποπληθυσμών(κλάσεων) τα οποία προέκυψαν από διαφορετικά πρωτόκολλα
αλληλούχισης, διαφορετικούς οργανισμούς, διαφορετικούς ιστούς και διαφορετικές
παθολογικές καταστάσεις.
Έτσι συγκρίνεται η απόδοση της ταξινόμησης μεταξύ των καταλογισμένων από κάθε
μέθοδο καταλογισμού συνόλων δεδομένων και των αρχικών συνόλων δεδομένων με
χρήση των μετρικών accuracy, recall, specificity, f1 score και precision με χρήση
boxplots και πινάκων σύγκρισης.
Οι μεταβολές μεταξύ των προ καταλογισμού και μετά καταλογισμού μετρικών
αναλύονται ανά μοντέλο ταξινόμησης ως προς όλες τις μεθόδους καταλογισμού αλλά
και ανά μέθοδο καταλογισμού ως προς όλα τα μοντέλα ταξινόμησης.
Ο καταλογισμός είναι η διαδικασία συμπλήρωσης των χαμένων τιμών που προκύπτουν
από αδυναμίες αποδοτικής πραγματοποίησης των στόχων του κάθε βήματος της
αλληλούχισης αλλά και λόγο της στοχαστικής έκφρασης των γονιδίων και της
αποικοδόμησης των μορίων mRNA. |
author2 |
Korniachtos, Anastasios |
author_facet |
Korniachtos, Anastasios Κορνιαχτός, Αναστάσιος |
author |
Κορνιαχτός, Αναστάσιος |
author_sort |
Κορνιαχτός, Αναστάσιος |
title |
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
title_short |
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
title_full |
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
title_fullStr |
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
title_full_unstemmed |
Πρόσφατες μέθοδοι imputation για single-cell RNA-seq δεδομένα |
title_sort |
πρόσφατες μέθοδοι imputation για single-cell rna-seq δεδομένα |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/24640 |
work_keys_str_mv |
AT korniachtosanastasios prosphatesmethodoiimputationgiasinglecellrnaseqdedomena AT korniachtosanastasios recentimputationmethodsforsinglecellrnaseqdata |
_version_ |
1771297326057390080 |