Περίληψη: | Η φυσική γλώσσα αποτελεί τον τρόπο που χρησιμοποιούμε οι άνθρωποι για να επικοινωνήσουμε μεταξύ μας, με την χρήση και τις δυνατότητες, των υπολογιστών να έχουν αυξηθεί με ραγδαίο ρυθμό τις τελευταίες δεκαετίες, διαθέτουμε ένα νέο πανίσχυρο εργαλείο για την επεξεργασία και κατανόηση της. Όταν συντάσσεται, μια πρόταση, σε κάθε λέξη μπορεί να αντιστοιχηθεί ένα μέρος του λόγου, το οποίο περιγράφει τον ρόλο της λέξης στην πρόταση. Η εύρεση των μερών του λόγου, μας επιτρέπει καλύτερη επεξεργασία μιας πρότασης και μοντελοποίησης της.
Στην παρούσα διπλωματική, περιγράφεται η θεωρία στην οποία πάνω στηρίζεται η επισήμανση μερών του λόγου, οι μεθοδολογίες και προσεγγίσεις της. Παρουσιάζονται κάποια μοντέλα τα οποία υλοποιήθηκαν και εφαρμόστηκαν στα ελληνικά και αγγλικά ώστε να συγκριθούν οι διαφορετικές τους συμπεριφορές.
Επιπλέον, αναγράφεται θεωρία που αφορά την ενεργή μάθηση η οποία μας επιτρέπει σε περιπτώσεις όπου διαθέτουμε κείμενα, άλλα όχι τις αντίστοιχες ετικέτες, να έχουμε εκπαίδευση με λιγότερες αναγκαίες επισημάνσεις. Τέλος, υλοποιούνται διάφορες μετρικές ενεργής μάθησης και συγκρίνονται πάλι τα αποτελέσματα στις γλώσσες των ελληνικών και αγγλικών.
|