Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση
Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://nemertes.library.upatras.gr/handle/10889/23309 |
id |
nemertes-10889-23309 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-233092022-09-28T08:00:03Z Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση Greek font creation with machine learning Αποστολόπουλος, Θεόδωρος Apostolopoulos, Theodoros Ελληνικές γραμματοσειρές Γεννητικά ανταγωνιστικά δίκτυα Pytorch Dataloader Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική τυπογραφία. Για την δημιουργία των ελληνικών γραμματοσειρών έγινε χρήση των Γεννητικών Ανταγωνιστικών Δικτύων. Για τις ανάγκες της διπλωματικής εργασίας και λόγω της έλλειψης ενός συνόλου δεδομένων με ελληνικές γραμματοσειρές, παράχθηκαν αρχικά ελληνικές γραμματοσειρές από υπάρχοντα TTF και OTF αρχεία. Για την παραγωγή ελληνικών γραμματοσειρών έγινε χρήση της βιβλιοθήκης PIL της γλώσσας Python. Έπειτα, οι παραχθείσες γραμματοσειρές οργανώθηκαν για την δημιουργία ενός custom made dataset, με τη χρήση του Dataloader του Pytorch. Εν συνεχεία, δημιουργήθηκε το μοντέλο του Γεννητικού Ανταγωνιστικού Δικτύου, το οποίο αποτελείται από δύο επιμέρους δίκτυα, αυτά του Δημιουργού και του Διευκρινιστή. Επιπλέον, υλοποιήθηκε ο αλγόριθμος εκπαίδευσης που κάνει χρήση της απόστασης Wasserstein με Gradient Penalty ως συνάρτηση σφάλματος. Για την εκπαίδευση του δικτύου χρησιμοποιήθηκαν τα δεδομένα του custom made dataset ως δεδομένα εκπαίδευσης. Τέλος, το δίκτυο εκπαιδεύτηκε για 2500 epochs, ενώ τα πειραματικά αποτελέσματα που εξάχθηκαν, αξιολογήθηκαν από ένα βαθύ συνελικτικό δίκτυο, το οποίο σχεδιάστηκε και εκπαιδεύτηκε με σκοπό την αξιολόγηση της αναγνωσιμότητας των αποτελεσμάτων. Όσον αφορά τα αποτελέσματα της αναγνωσιμότητας, αυτά διακυμάνθηκαν από 95.625% για 100 εποχές φτάνοντας στο 97.667% στις 2500 εποχές. The past three decades, a great interest for fonts in digital typography has been raised. The goal of this diploma thesis is the creation of new Greek fonts using Generative Adversarial Networks-GANs. Due to the absence of a large dataset of Greek fonts, new Greek fonts were created by TTF and OTF files using PIL Python library. The Greek fonts were organized for the creation of a custom dataset. The custom dataset was made with the Dataloader of Pytorch Framework. A Generative Adversarial Network model was created, which is consists of the Generator and the Discriminator Network. The training algorithm used the Wasserstein Distance with Gradient Penalty as a Loss Function and as training data was used the custom-made dataset. The model was trained for 2500 epochs and the extracted experimental results were evaluated with a Deep Convolutional Network, which was created and trained for legibility evaluation purposes. The legibility evaluation of the experimental results was varied from 95.625% for 100 epochs to 97.667% for 2500 epochs. 2022-09-28T07:48:01Z 2022-09-28T07:48:01Z 2022 https://nemertes.library.upatras.gr/handle/10889/23309 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ελληνικές γραμματοσειρές Γεννητικά ανταγωνιστικά δίκτυα Pytorch Dataloader |
spellingShingle |
Ελληνικές γραμματοσειρές Γεννητικά ανταγωνιστικά δίκτυα Pytorch Dataloader Αποστολόπουλος, Θεόδωρος Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
description |
Τα τελευταία 30 χρόνια η ψηφιακή τυπογραφία έχει εξελιχθεί σε μεγάλο βαθμό, όμως με την πλειοψηφία των υπαρχουσών γραμματοσειρών να απεικονίζουν χαρακτήρες της αγγλικής αλφαβήτου. Στόχος της παρούσας εργασίας ήταν η δημιουργία γραμματοσειρών με ελληνικούς χαρακτήρες για την χρήση τους στην ελληνική τυπογραφία. Για την δημιουργία των ελληνικών γραμματοσειρών έγινε χρήση των Γεννητικών Ανταγωνιστικών Δικτύων. Για τις ανάγκες της διπλωματικής εργασίας και λόγω της έλλειψης ενός συνόλου δεδομένων με ελληνικές γραμματοσειρές, παράχθηκαν αρχικά ελληνικές γραμματοσειρές από υπάρχοντα TTF και OTF αρχεία. Για την παραγωγή ελληνικών γραμματοσειρών έγινε χρήση της βιβλιοθήκης PIL της γλώσσας Python. Έπειτα, οι παραχθείσες γραμματοσειρές οργανώθηκαν για την δημιουργία ενός custom made dataset, με τη χρήση του Dataloader του Pytorch. Εν συνεχεία, δημιουργήθηκε το μοντέλο του Γεννητικού Ανταγωνιστικού Δικτύου, το οποίο αποτελείται από δύο επιμέρους δίκτυα, αυτά του Δημιουργού και του Διευκρινιστή. Επιπλέον, υλοποιήθηκε ο αλγόριθμος εκπαίδευσης που κάνει χρήση της απόστασης Wasserstein με Gradient Penalty ως συνάρτηση σφάλματος. Για την εκπαίδευση του δικτύου χρησιμοποιήθηκαν τα δεδομένα του custom made dataset ως δεδομένα εκπαίδευσης. Τέλος, το δίκτυο εκπαιδεύτηκε για 2500 epochs, ενώ τα πειραματικά αποτελέσματα που εξάχθηκαν, αξιολογήθηκαν από ένα βαθύ συνελικτικό δίκτυο, το οποίο σχεδιάστηκε και εκπαιδεύτηκε με σκοπό την αξιολόγηση της αναγνωσιμότητας των αποτελεσμάτων. Όσον αφορά τα αποτελέσματα της αναγνωσιμότητας, αυτά διακυμάνθηκαν από 95.625% για 100 εποχές φτάνοντας στο 97.667% στις 2500 εποχές. |
author2 |
Apostolopoulos, Theodoros |
author_facet |
Apostolopoulos, Theodoros Αποστολόπουλος, Θεόδωρος |
author |
Αποστολόπουλος, Θεόδωρος |
author_sort |
Αποστολόπουλος, Θεόδωρος |
title |
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
title_short |
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
title_full |
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
title_fullStr |
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
title_full_unstemmed |
Κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
title_sort |
κατασκευή ελληνικών γραμματοσειρών με μηχανική μάθηση |
publishDate |
2022 |
url |
https://nemertes.library.upatras.gr/handle/10889/23309 |
work_keys_str_mv |
AT apostolopoulostheodōros kataskeuēellēnikōngrammatoseirōnmemēchanikēmathēsē AT apostolopoulostheodōros greekfontcreationwithmachinelearning |
_version_ |
1771297335569022976 |