Αναγνώριση γλώσσας κειμένου με βάση στατιστικά μοντέλα

Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα π...

Full description

Bibliographic Details
Main Author:	Τσέλιος, Βασίλειος
Other Authors:	Φακωτάκης, Νικόλαος
Format:	Thesis
Language:	Greek
Published:	2013
Subjects:	Ν-γράμματα Αναγνώριση γλώσσας N-gramms Language recognition 004
Online Access:	http://hdl.handle.net/10889/5951

Description
Summary:	Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα που επιβεβαιώνουν την υπάρχουσα θεωρία για την ικανότητα αναγνώρισης γλώσσας ενός κειμένου χρησιμοποιώντας τη μέθοδο των Ν-γραμμάτων.

Αναγνώριση γλώσσας κειμένου με βάση στατιστικά μοντέλα

Similar Items