Αυτόματο φιλτάρισμα ανεπιθύμητης ηλεκτρονικής αλληλογραφίας με χρήση μεθόδων μηχανικής μάθησης

H Εργασία αυτή διαπραγματεύεται μια προσέγγιση για το αυτόματο φιλτράρισμα της ανεπιθύμητης Ηλ. Αλληλογραφίας βασισμένη σε μεθόδους Μηχανικής Μάθησης (Μ.Μ). Πιο συγκεκριμένα δημιουργήθηκε μια εφαρμογή εξαγωγής χαρακτηριστικών από Βάσεις Δεδομένων Ηλ. Αλληλογραφίας που υπάρχουν διαθέσιμες στον παγκόσ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ανυφαντής, Διονύσιος
Άλλοι συγγραφείς: Χατζηλυγερούδης, Ιωάννης
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2008
Θέματα:
Διαθέσιμο Online:http://nemertes.lis.upatras.gr/jspui/handle/10889/749
Περιγραφή
Περίληψη:H Εργασία αυτή διαπραγματεύεται μια προσέγγιση για το αυτόματο φιλτράρισμα της ανεπιθύμητης Ηλ. Αλληλογραφίας βασισμένη σε μεθόδους Μηχανικής Μάθησης (Μ.Μ). Πιο συγκεκριμένα δημιουργήθηκε μια εφαρμογή εξαγωγής χαρακτηριστικών από Βάσεις Δεδομένων Ηλ. Αλληλογραφίας που υπάρχουν διαθέσιμες στον παγκόσμιο Ιστό και στην συνέχεια η προκύπτουσα γνώση ενσωματώθηκε σε ένα MUA που δημιουργήθηκε για τον σκοπό αυτό. Το σύνολο των προσπαθειών επικεντρώθηκε γύρω από αλγορίθμους Μ.Μ και πιο συγκεκριμένα Naïve Bayes, AdaBoost-Naïve-Bayes, C4.5, SVMs, Decision-Stump & AdaBoost, KStar, Random Forest, Νευρωνικά Δίκτυα, και RBF. Πιο ειδικά στην εργασία αναπτύσσονται τα παρακάτω : • Παρουσίαση της πορείας της Αυτόματης Κατηγοριοποίησης Κειμένου και των Tεχνικών/Aλγορίθμων Μηχανικής Μάθησης (Μ.Μ) στο συγκεκριμένο πρόβλημα. • Εξαγωγή παραμέτρων από Βάσεις ηλ. Αλληλογραφίας και σώματα ηλ. μηνυμάτων. • Αξιολόγηση της συμπεριφοράς των προαναφερθέντων αλγορίθμων Μ.Μ. • Βελτιστοποίηση της απόδοσης των αλγορίθμων με μελέτη της επίδρασης, του τύπου και του πλήθους των παραμέτρων του χαρακτηριστικού διανύσματος. • Ανάπτυξη του πραγματικού συστήματος φιλτραρίσματος και ενσωμάτωση του σε περιβάλλον διαχείρισης ηλ. Αλληλογραφίας.