Περίληψη: | H Εργασία αυτή διαπραγματεύεται μια προσέγγιση για το αυτόματο φιλτράρισμα της ανεπιθύμητης Ηλ. Αλληλογραφίας βασισμένη σε μεθόδους Μηχανικής Μάθησης (Μ.Μ). Πιο συγκεκριμένα δημιουργήθηκε μια εφαρμογή εξαγωγής χαρακτηριστικών από Βάσεις Δεδομένων Ηλ. Αλληλογραφίας που υπάρχουν διαθέσιμες στον παγκόσμιο Ιστό και στην συνέχεια η προκύπτουσα γνώση ενσωματώθηκε σε ένα MUA που δημιουργήθηκε για τον σκοπό αυτό. Το σύνολο των προσπαθειών επικεντρώθηκε γύρω από αλγορίθμους Μ.Μ και πιο συγκεκριμένα Naïve Bayes, AdaBoost-Naïve-Bayes, C4.5, SVMs, Decision-Stump & AdaBoost, KStar, Random Forest, Νευρωνικά Δίκτυα, και RBF. Πιο ειδικά στην εργασία αναπτύσσονται τα παρακάτω :
• Παρουσίαση της πορείας της Αυτόματης Κατηγοριοποίησης Κειμένου και των Tεχνικών/Aλγορίθμων Μηχανικής Μάθησης (Μ.Μ) στο συγκεκριμένο πρόβλημα.
• Εξαγωγή παραμέτρων από Βάσεις ηλ. Αλληλογραφίας και σώματα ηλ. μηνυμάτων.
• Αξιολόγηση της συμπεριφοράς των προαναφερθέντων αλγορίθμων Μ.Μ.
• Βελτιστοποίηση της απόδοσης των αλγορίθμων με μελέτη της επίδρασης, του τύπου και του πλήθους των παραμέτρων του χαρακτηριστικού διανύσματος.
• Ανάπτυξη του πραγματικού συστήματος φιλτραρίσματος και ενσωμάτωση του σε περιβάλλον διαχείρισης ηλ. Αλληλογραφίας.
|