Περίληψη: | Το διάνυσμα προτύπων αποτελεί σύνθεση ενός συνόλου χαρακτηριστικών γνωρισμάτων και ταξινομείται σε δύο κατηγορίες: τα αρχικά χαρακτηριστικά γνωρίσματα και ένα σύνολο μη γραμμικών προβολών των αρχικών χαρακτηριστικών γνωρισμάτων. Στην ταξινόμηση, η κατασκευή χαρακτηριστικών γνωρισμάτων είναι ένα βήμα προ-επεξεργασίας στο οποίο ένα ή περισσότερα γνωρίσματα κατασκευάζονται από ένα αρχικό σύνολο.
Ο αριθμός και ο τύπος των χαρακτηριστικών γνωρισμάτων είναι κρίσιμα για την ακρίβεια ταξινόμησης και την υπολογιστική πολυπλοκότητα. Καθώς ο αριθμός των χαρακτηριστικών γνωρισμάτων αυξάνει, απαιτούνται πρόσθετα παραδείγματα για να ολοκληρώσουν μια αξιόπιστη διαδικασία κατάρτισης, επιτρέποντας περισσότερες δυνατότητες αξιόπιστης γενίκευσης χωρίς υπέρ-εκπαίδευση αποτελεσμάτων.
Σε αυτή τη διπλωματική εργασία εξετάζουμε και αναλύουμε τη χρήση του Γενετικού προγραμματισμού για την προ-επεξεργασία δεδομένων έτσι ώστε να κατασκευάσουμε μη γραμμικά, ιδιαίτερα προφητικά, χαρακτηριστικά γνωρίσματα από τα αρχικά. Για το σκοπό αυτό χρησιμοποιούμε γενετικούς αλγορίθμους και συγκεκριμένα τον C4.5 αλγόριθμο εκμάθησης δέντρων απόφασης, τον G-Net, ένα διανεμημένο εξελικτικό αλγόριθμο ικανό να συμπεράνει τους ταξινομητές από τα προ-συγκεντρωμένα στοιχεία καθώς και τη μέθοδο που βασίζεται στο συνδυασμό της καθιερωμένης τεχνικής της γραμματικής εξέλιξης και των τεχνητών νευρικών δικτύων.
Εφαρμόζοντας τον γενετικό προγραμματισμό σε διάφορα σύνολα δεδομένων ταξινόμησης επιτυγχάνουμε μεγαλύτερη ακρίβεια ταξινόμησης. Όλοι οι αλγόριθμοι που χρησιμοποιήθηκαν έδωσαν πολύ καλύτερη απόδοση στα σύνολα δεδομένων όταν συμπεριλήφθηκε μια ενιαία εξελιγμένη μεταβλητή, επιλύοντας προβλήματα που βρίσκονται πολύ συχνά στις εφαρμογές υπολογιστών όπως Ιατρική και ελαττωματική διάγνωση, πρόγνωση, αναγνώριση εικόνας, κατηγοριοποίηση κειμένων, προσαρμοστική σκιαγράφηση χρηστών.
|