Περίληψη: | Τα τελευταία χρόνια ο κλάδος της επιστήμης της Βιοπληροφορικής γνωρίζει ιδιαίτερη ανάπτυξη, με ορόσημο το πρόγραμμα του ανθρώπινου γονιδιώματος (human genome project), το οποίο ως στόχο είχε την απόκτηση βασικών πληροφοριών που αφορούν το γενετικό μας υπόστρωμα και την ανάλυση και σύνθεση των πληροφοριών αυτών για πληρέστερη κατανόηση του ρόλου των διαφόρων γονιδίων στη διατήρηση της υγείας και στη δημιουργία γενετικών νόσων.
Ως αποτέλεσμα των ερευνών πάνω στην καταγραφή και την αποκρυπτογράφηση του γονιδιώματος των οργανισμών, ο όγκος των προς επεξεργασία δεδομένων που προκύπτουν έχει αυξηθεί σημαντικά και αναμένεται να πολλαπλασιάζεται τα επόμενα χρόνια. Έτσι, καθίσταται αναγκαία η έρευνα σε τεχνικές επεξεργασίας και διαχείρισης των δεδομένων αυτών που ως στόχο έχουν την μείωση της διαστατικότητάς τους.
Η παρούσα διπλωματική εργασία ακολουθεί αυτή την κατεύθυνση και χωρίζεται σε δύο μέρη. Το πρώτο μέρος είναι βιβλιογραφικό και ασχολείται με την ανασκόπηση της ερευνητικής περιοχής και την θεωρητική τεκμηρίωση των γενικότερων τεχνικών μείωσης διαστατικότητας, σε δεδομένα μεγάλου όγκου που προκύπτουν από τεχνικές DNA ακολουθιών. Το δεύτερο πειραματικό τμήμα, επιχειρεί την συγκριτική μελέτη 4 αλγορίθμων μείωσης της διάστασης σε προβλήματα ταξινόμησης.
|