Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση

Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Αποστολόπουλος, Θεόδωρος
Άλλοι συγγραφείς:	Apostolopoulos, Theodoros
Γλώσσα:	Greek
Έκδοση:	2022
Θέματα:	Ελληνικές γραμματοσειρές Γεννητικά ανταγωνιστικά δίκτυα Pytorch Dataloader
Διαθέσιμο Online:	https://nemertes.library.upatras.gr/handle/10889/23309

Περιγραφή
Περίληψη:	Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική τυπογραφία. Για την δημιουργία των ελληνικών γραμματοσειρών έγινε χρήση των Γεννητικών Ανταγωνιστικών Δικτύων. Για τις ανάγκες της διπλωματικής εργασίας και λόγω της έλλειψης ενός συνόλου δεδομένων με ελληνικές γραμματοσειρές, παράχθηκαν αρχικά ελληνικές γραμματοσειρές από υπάρχοντα TTF και OTF αρχεία. Για την παραγωγή ελληνικών γραμματοσειρών έγινε χρήση της βιβλιοθήκης PIL της γλώσσας Python. Έπειτα, οι παραχθείσες γραμματοσειρές οργανώθηκαν για την δημιουργία ενός custom made dataset, με τη χρήση του Dataloader του Pytorch. Εν συνεχεία, δημιουργήθηκε το μοντέλο του Γεννητικού Ανταγωνιστικού Δικτύου, το οποίο αποτελείται από δύο επιμέρους δίκτυα, αυτά του Δημιουργού και του Διευκρινιστή. Επιπλέον, υλοποιήθηκε ο αλγόριθμος εκπαίδευσης που κάνει χρήση της απόστασης Wasserstein με Gradient Penalty ως συνάρτηση σφάλματος. Για την εκπαίδευση του δικτύου χρησιμοποιήθηκαν τα δεδομένα του custom made dataset ως δεδομένα εκπαίδευσης. Τέλος, το δίκτυο εκπαιδεύτηκε για 2500 epochs, ενώ τα πειραματικά αποτελέσματα που εξάχθηκαν, αξιολογήθηκαν από ένα βαθύ συνελικτικό δίκτυο, το οποίο σχεδιάστηκε και εκπαιδεύτηκε με σκοπό την αξιολόγηση της αναγνωσιμότητας των αποτελεσμάτων. Όσον αφορά τα αποτελέσματα της αναγνωσιμότητας, αυτά διακυμάνθηκαν από 95.625% για 100 εποχές φτάνοντας στο 97.667% στις 2500 εποχές.

Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση

Παρόμοια τεκμήρια