Αναγνώριση γλώσσας κειμένου με βάση στατιστικά μοντέλα

Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα π...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τσέλιος, Βασίλειος
Άλλοι συγγραφείς: Φακωτάκης, Νικόλαος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2013
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/5951
Περιγραφή
Περίληψη:Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα που επιβεβαιώνουν την υπάρχουσα θεωρία για την ικανότητα αναγνώρισης γλώσσας ενός κειμένου χρησιμοποιώντας τη μέθοδο των Ν-γραμμάτων.