Εφαρμογές της μηχανικής μάθησης στην κατηγοριοποίηση κεμένου

Το αντικείμενο της μεταπτυχιακής αυτής εργασίας είναι η αυτόματη κα-τηγοριο-ποίηση κειμένου (text classification) χρησιμοποιώντας τεχνι-κές μηχανικής μάθη-σης. Με τον όρο κατηγοριοποίηση κειμένου εννοούμε την διαδικασία αυτόματης κατάταξης κειμένων φυσικής γλώσσας σε προκα-θορισμένο αριθμό θεματικών...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αθανασοπούλου, Ευαγγελία - Ελένη
Άλλοι συγγραφείς: Πιντέλας, Παναγιώτης
Γλώσσα:Greek
Έκδοση: 2007
Θέματα:
Διαθέσιμο Online:http://nemertes.lis.upatras.gr/jspui/handle/10889/506
Περιγραφή
Περίληψη:Το αντικείμενο της μεταπτυχιακής αυτής εργασίας είναι η αυτόματη κα-τηγοριο-ποίηση κειμένου (text classification) χρησιμοποιώντας τεχνι-κές μηχανικής μάθη-σης. Με τον όρο κατηγοριοποίηση κειμένου εννοούμε την διαδικασία αυτόματης κατάταξης κειμένων φυσικής γλώσσας σε προκα-θορισμένο αριθμό θεματικών κατηγοριών. Σήμερα, η κατηγοριοποίηση κει-μένου χρησιμοποιείται σε διάφορα περιβάλλοντα εφαρμογών, όπως για πα-ράδειγμα στη δημιουργία ευρετηρίων που προέρχονται από κείμενα, στην αυτόματη κατηγοριοποίηση ειδήσεων, στην κωδικοποίηση βιβλίων σε βι-βλιοθήκες, στο φιλτράρισμα της ηλεκτρονικής αλληλογραφίας (spam emails), στα αποτελέσματα μηχανών αναζήτησης στο διαδίκτυο (π.χ. Yahoo, Google), κ. α. Συνοπτικά, στην παρούσα εργασία: 1. Παρουσιάζεται η σημερινή δραστηριότητα της μηχανικής μάθησης στους τομείς της αυτόματης κατηγοριοποίησης κειμένου. 2. Δείχνεται πειραματικά η υψηλή απόδοση που επιτυγχάνεται με τη χρήση τεχνικών μηχανικής μάθησης για την αντιμετώπιση του προβλήμα-τος. 3. Παρουσιάζεται η δημιουργία ενός νέου αλγόριθμου για την βελτιστοποίηση της ακρίβειας. 4. Ερμηνεύονται τα αποτελέσματα των πραγματοποιηθέντων πειραμάτων και τέλος 5. Γενικεύονται όπου είναι δυνατόν τα συμπεράσματα που προκύπτουν από την ως άνω μελέτη.