Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση

Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αποστολόπουλος, Θεόδωρος
Άλλοι συγγραφείς: Apostolopoulos, Theodoros
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://nemertes.library.upatras.gr/handle/10889/23309
id nemertes-10889-23309
record_format dspace
spelling nemertes-10889-233092022-09-28T08:00:03Z Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση Greek font creation with machine learning Αποστολόπουλος, Θεόδωρος Apostolopoulos, Theodoros Ελληνικές γραμματοσειρές Γεννητικά ανταγωνιστικά δίκτυα Pytorch Dataloader Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική τυπογραφία. Για την δημιουργία των ελληνικών γραμματοσειρών έγινε χρήση των Γεννητικών Ανταγωνιστικών Δικτύων. Για τις ανάγκες της διπλωματικής εργασίας και λόγω της έλλειψης ενός συνόλου δεδομένων με ελληνικές γραμματοσειρές, παράχθηκαν αρχικά ελληνικές γραμματοσειρές από υπάρχοντα TTF και OTF αρχεία. Για την παραγωγή ελληνικών γραμματοσειρών έγινε χρήση της βιβλιοθήκης PIL της γλώσσας Python. Έπειτα, οι παραχθείσες γραμματοσειρές οργανώθηκαν για την δημιουργία ενός custom made dataset, με τη χρήση του Dataloader του Pytorch. Εν συνεχεία, δημιουργήθηκε το μοντέλο του Γεννητικού Ανταγωνιστικού Δικτύου, το οποίο αποτελείται από δύο επιμέρους δίκτυα, αυτά του Δημιουργού και του Διευκρινιστή. Επιπλέον, υλοποιήθηκε ο αλγόριθμος εκπαίδευσης που κάνει χρήση της απόστασης Wasserstein με Gradient Penalty ως συνάρτηση σφάλματος. Για την εκπαίδευση του δικτύου χρησιμοποιήθηκαν τα δεδομένα του custom made dataset ως δεδομένα εκπαίδευσης. Τέλος, το δίκτυο εκπαιδεύτηκε για 2500 epochs, ενώ τα πειραματικά αποτελέσματα που εξάχθηκαν, αξιολογήθηκαν από ένα βαθύ συνελικτικό δίκτυο, το οποίο σχεδιάστηκε και εκπαιδεύτηκε με σκοπό την αξιολόγηση της αναγνωσιμότητας των αποτελεσμάτων. Όσον αφορά τα αποτελέσματα της αναγνωσιμότητας, αυτά διακυμάνθηκαν από 95.625% για 100 εποχές φτάνοντας στο 97.667% στις 2500 εποχές. The past three decades, a great interest for fonts in digital typography has been raised. The goal of this diploma thesis is the creation of new Greek fonts using Generative Adversarial Networks-GANs. Due to the absence of a large dataset of Greek fonts, new Greek fonts were created by TTF and OTF files using PIL Python library. The Greek fonts were organized for the creation of a custom dataset. The custom dataset was made with the Dataloader of Pytorch Framework. A Generative Adversarial Network model was created, which is consists of the Generator and the Discriminator Network. The training algorithm used the Wasserstein Distance with Gradient Penalty as a Loss Function and as training data was used the custom-made dataset. The model was trained for 2500 epochs and the extracted experimental results were evaluated with a Deep Convolutional Network, which was created and trained for legibility evaluation purposes. The legibility evaluation of the experimental results was varied from 95.625% for 100 epochs to 97.667% for 2500 epochs. 2022-09-28T07:48:01Z 2022-09-28T07:48:01Z 2022 https://nemertes.library.upatras.gr/handle/10889/23309 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ελληνικές γραμματοσειρές
Γεννητικά ανταγωνιστικά δίκτυα
Pytorch
Dataloader
spellingShingle Ελληνικές γραμματοσειρές
Γεννητικά ανταγωνιστικά δίκτυα
Pytorch
Dataloader
Αποστολόπουλος, Θεόδωρος
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
description Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική τυπογραφία. Για την δημιουργία των ελληνικών γραμματοσειρών έγινε χρήση των Γεννητικών Ανταγωνιστικών Δικτύων. Για τις ανάγκες της διπλωματικής εργασίας και λόγω της έλλειψης ενός συνόλου δεδομένων με ελληνικές γραμματοσειρές, παράχθηκαν αρχικά ελληνικές γραμματοσειρές από υπάρχοντα TTF και OTF αρχεία. Για την παραγωγή ελληνικών γραμματοσειρών έγινε χρήση της βιβλιοθήκης PIL της γλώσσας Python. Έπειτα, οι παραχθείσες γραμματοσειρές οργανώθηκαν για την δημιουργία ενός custom made dataset, με τη χρήση του Dataloader του Pytorch. Εν συνεχεία, δημιουργήθηκε το μοντέλο του Γεννητικού Ανταγωνιστικού Δικτύου, το οποίο αποτελείται από δύο επιμέρους δίκτυα, αυτά του Δημιουργού και του Διευκρινιστή. Επιπλέον, υλοποιήθηκε ο αλγόριθμος εκπαίδευσης που κάνει χρήση της απόστασης Wasserstein με Gradient Penalty ως συνάρτηση σφάλματος. Για την εκπαίδευση του δικτύου χρησιμοποιήθηκαν τα δεδομένα του custom made dataset ως δεδομένα εκπαίδευσης. Τέλος, το δίκτυο εκπαιδεύτηκε για 2500 epochs, ενώ τα πειραματικά αποτελέσματα που εξάχθηκαν, αξιολογήθηκαν από ένα βαθύ συνελικτικό δίκτυο, το οποίο σχεδιάστηκε και εκπαιδεύτηκε με σκοπό την αξιολόγηση της αναγνωσιμότητας των αποτελεσμάτων. Όσον αφορά τα αποτελέσματα της αναγνωσιμότητας, αυτά διακυμάνθηκαν από 95.625% για 100 εποχές φτάνοντας στο 97.667% στις 2500 εποχές.
author2 Apostolopoulos, Theodoros
author_facet Apostolopoulos, Theodoros
Αποστολόπουλος, Θεόδωρος
author Αποστολόπουλος, Θεόδωρος
author_sort Αποστολόπουλος, Θεόδωρος
title Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
title_short Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
title_full Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
title_fullStr Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
title_full_unstemmed Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
title_sort κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
publishDate 2022
url https://nemertes.library.upatras.gr/handle/10889/23309
work_keys_str_mv AT apostolopoulostheodōros kataskeuēellēnikōngrammatoseirōnmemēchanikēmathēsē
AT apostolopoulostheodōros greekfontcreationwithmachinelearning
_version_ 1771297335569022976