Τεχνικές μείωσης διαστάσεων σε δεδομένα μεγάλου όγκου από τεχνικές DNA αλληλουχιών

Η Βιοπληροφορική (bioinformatics) είναι ένα διεπιστημονικό πεδίο που αναπτύσσει μεθόδους και διαδικασίες για τη κατανόηση βιολογικών δεδομένων. Ως ένα διεπιστημονικό πεδίο της επιστήμης, η Βιοπληροφορική συνδυάζει την επιστήμη της πληροφορίας, τη στατιστική, τα μαθηματικά και τη μηχανική για να α...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μπάρμπας, Πέτρος
Άλλοι συγγραφείς: Μακρής, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13148
Περιγραφή
Περίληψη:Η Βιοπληροφορική (bioinformatics) είναι ένα διεπιστημονικό πεδίο που αναπτύσσει μεθόδους και διαδικασίες για τη κατανόηση βιολογικών δεδομένων. Ως ένα διεπιστημονικό πεδίο της επιστήμης, η Βιοπληροφορική συνδυάζει την επιστήμη της πληροφορίας, τη στατιστική, τα μαθηματικά και τη μηχανική για να αναλύσει και να ερμηνεύσει βιολογικά δεδομένα. Η Βιοπληροφορική έχει χρησιμοποιηθεί για in silico (υπολογιστικές) αναλύσεις βιολογικών ερωτημάτων χρησιμοποιώντας μαθηματικές και στατιστικές τεχνικές. Τα τελευταία χρόνια, αυτός ο κλάδος της επιστήμης γνωρίζει ιδιαίτερη ανάπτυξη, με ορόσημο το πρόγραμμα του ανθρώπινου γονιδιώματος (human genome project), το οποίο ως στόχο είχε την απόκτηση βασικών πληροφοριών που αφορούν το γενετικό μας υπόστρωμα και την ανάλυση και σύνθεση των πληροφοριών αυτών για πληρέστερη κατανόηση του ρόλου των διαφόρων γονιδίων στη διατήρηση της υγείας και τη δημιουργία γενετικών νόσων. Ως αποτέλεσμα των ερευνών πάνω στην καταγραφή και την αποκρυπτογράφηση του γονιδιώματος των οργανισμών, ο όγκος των προς επεξεργασία δεδομένων που προκύπτουν έχει αυξηθεί σημαντικά και αναμένεται να πολλαπλασιάζεται τα επόμενα χρόνια. Έτσι, καθίσταται αναγκαία η έρευνα σε τεχνικές επεξεργασίας και διαχείρισης των δεδομένων αυτών που ως στόχο έχουν την μείωση της διαστατικότητάς τους και την οπτικοποίησή τους με γραφήματα δύο ή το πολύ τριών διαστάσεων. Η παρούσα διπλωματική εργασία ακολουθεί αυτή την κατεύθυνση και χωρίζεται σε δύο μέρη. Το πρώτο μέρος είναι βιβλιογραφικό και ασχολείται με την ανασκόπηση της ερευνητικής περιοχής και την θεωρητική τεκμηρίωση των γενικότερων τεχνικών μείωσης διαστατικότητας, σε δεδομένα μεγάλου όγκου που προκύπτουν από τεχνικές ακολουθιών, παρουσιάζοντας μια γενικότερη επισκόπηση των DNA σημαντικότερων μεθοδολογιών. Το δεύτερο πειραματικό τμήμα, επιχειρεί να επιβεβαιώσει την απόδοση των παραπάνω τεχνικών πάνω σε πραγματικά δεδομένα του πεδίου της Βιοπληροφορικής, αξιολογώντας τες ως προς την απόδοσή τους όσο αναφορά το χρόνο ,την κατηγοριοποίηση που πετυχαίνουν και την απόδοσή τους όσο αναφορά την οπτικοποίηση των δεδομένων.