Οπτική αναγνώριση χειρόγραφων προτάσεων κατηγορηματικής λογικής πρώτης τάξης μέσω τεχνητού νευρωνικού δικτύου

Στην παρούσα εργασία αναπτύχθηκε ένα πρόγραμμα οπτικής αναγνώρισης χαρακτήρων (OCR) σε γλώσσα Java, όπου μπορεί να αναγνωρίζει χειρόγραφες προτάσεις κατηγορηματικής λογικής πρώτης τάξης και να παράγει ένα τελικό επεξεργάσιμο αρχείο κειμένου με τους αναγνωρισμένους χαρακτήρες. Η λειτουργία του βασίζε...

Full description

Bibliographic Details
Main Author: Αμπελακιώτης, Βάιος
Other Authors: Ampelakiotis, Vaios
Language:Greek
Published: 2020
Subjects:
Online Access:http://hdl.handle.net/10889/14194
Description
Summary:Στην παρούσα εργασία αναπτύχθηκε ένα πρόγραμμα οπτικής αναγνώρισης χαρακτήρων (OCR) σε γλώσσα Java, όπου μπορεί να αναγνωρίζει χειρόγραφες προτάσεις κατηγορηματικής λογικής πρώτης τάξης και να παράγει ένα τελικό επεξεργάσιμο αρχείο κειμένου με τους αναγνωρισμένους χαρακτήρες. Η λειτουργία του βασίζεται πάνω στη χρήση Νευρωνικών Δικτύων πρόσθιας τροφοδότησης που αποτελούν το κυριότερο μέρος του πεδίου βαθιάς μάθησης (deepLearning) της Τεχνητής νοημοσύνης. Πιο συγκεκριμένα, αφού ερευνήθηκαν τρείς αλγόριθμοι εκπαίδευσης, δημιουργήθηκε και εκπαιδεύτηκε ένα νευρωνικό δίκτυο με τον αλγόριθμο Stochastic Gradient Descent πάνω σε ένα TrainSet 16750 δειγμάτων διαστάσεων 28x28 ενώ η απόδοσή του ελέγχθηκε με ένα TestSet 7947 δειγμάτων. Η γενική μεθοδολογία που ακολουθήθηκε είναι: η κατασκευή απο την αρχή ενός DataSet απο χειρόγραφα δείγματα 10 ανθρώπων, η προεπεξεργασία τους με χρήση αλγορίθμων Υπολογιστικής Όρασης της βιβλιοθήκης openCV, η μετατροπή τους σε αρχείο csv, η δημιουργία-εκπαίδευση του κατάλληλου νευρωνικού δικτύου με τη βιβλιοθήκη Encog και η αξιολόγησή του. Η τελική απόδοση ακρίβειας που επιτεύχθηκε πάνω στο συγκεκριμένο TestSet ήταν 90.13%.