Οπτική αναγνώριση χειρόγραφων προτάσεων κατηγορηματικής λογικής πρώτης τάξης μέσω τεχνητού νευρωνικού δικτύου

Στην παρούσα εργασία αναπτύχθηκε ένα πρόγραμμα οπτικής αναγνώρισης χαρακτήρων (OCR) σε γλώσσα Java, όπου μπορεί να αναγνωρίζει χειρόγραφες προτάσεις κατηγορηματικής λογικής πρώτης τάξης και να παράγει ένα τελικό επεξεργάσιμο αρχείο κειμένου με τους αναγνωρισμένους χαρακτήρες. Η λειτουργία του βασίζε...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αμπελακιώτης, Βάιος
Άλλοι συγγραφείς: Ampelakiotis, Vaios
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14194
Περιγραφή
Περίληψη:Στην παρούσα εργασία αναπτύχθηκε ένα πρόγραμμα οπτικής αναγνώρισης χαρακτήρων (OCR) σε γλώσσα Java, όπου μπορεί να αναγνωρίζει χειρόγραφες προτάσεις κατηγορηματικής λογικής πρώτης τάξης και να παράγει ένα τελικό επεξεργάσιμο αρχείο κειμένου με τους αναγνωρισμένους χαρακτήρες. Η λειτουργία του βασίζεται πάνω στη χρήση Νευρωνικών Δικτύων πρόσθιας τροφοδότησης που αποτελούν το κυριότερο μέρος του πεδίου βαθιάς μάθησης (deepLearning) της Τεχνητής νοημοσύνης. Πιο συγκεκριμένα, αφού ερευνήθηκαν τρείς αλγόριθμοι εκπαίδευσης, δημιουργήθηκε και εκπαιδεύτηκε ένα νευρωνικό δίκτυο με τον αλγόριθμο Stochastic Gradient Descent πάνω σε ένα TrainSet 16750 δειγμάτων διαστάσεων 28x28 ενώ η απόδοσή του ελέγχθηκε με ένα TestSet 7947 δειγμάτων. Η γενική μεθοδολογία που ακολουθήθηκε είναι: η κατασκευή απο την αρχή ενός DataSet απο χειρόγραφα δείγματα 10 ανθρώπων, η προεπεξεργασία τους με χρήση αλγορίθμων Υπολογιστικής Όρασης της βιβλιοθήκης openCV, η μετατροπή τους σε αρχείο csv, η δημιουργία-εκπαίδευση του κατάλληλου νευρωνικού δικτύου με τη βιβλιοθήκη Encog και η αξιολόγησή του. Η τελική απόδοση ακρίβειας που επιτεύχθηκε πάνω στο συγκεκριμένο TestSet ήταν 90.13%.