Περίληψη: | Τα Generative Adversarial Networks (στην παρούσα εργασία θα αναφέρονται στο εξής για λόγους συντομίας ως «GANs») αποτελούν ένα καινοτόμο framework που βασίζεται στο συνδυασμό της βαθιάς μηχανικής μάθησης και των νευρωνικών δικτύων.
Πρόκειται για ένα μοντέλο το οποίο βρίσκει ενδιαφέρουσες εφαρμογές στη σύγχρονη εποχή, όμως λόγω του ότι αναπτύχθηκε σχετικά πρόσφατα οι προκλήσεις είναι ακόμα αρκετές. Η μεγαλύτερη εξ’ αυτών είναι η διαδικασία της εκπαίδευσης και ως εκ τούτου έχουν υλοποιηθεί μέχρι σήμερα εναλλακτικοί αλγόριθμοι, τεχνικές ή και αρχιτεκτονικές με διαφορετικές προσεγγίσεις σε σχέση με το αρχικό μοντέλο προκειμένου να επιλυθούν όσο το δυνατόν περισσότερα από τα προβλήματα αυτά.
Κατά την διπλωματική αυτή εργασία θα γίνει μια ανασκόπηση προηγούμενων ερευνών μέχρι το σημείο της ανάπτυξης του αρχικού GAN μοντέλου το οποίο βασίστηκε στην ιδέα της θεωρίας παιγνίων. Στη συνέχεια θα παρουσιαστεί το αρχικό μοντέλο GAN, καταλήγοντας μάλιστα σε ορισμένα προβλήματα που συναντώνται κατά τη διάρκεια της εκπαίδευσής του και δυσχεραίνουν την όλη διαδικασία. Είναι σημαντικό επομένως να καταγραφούν αμέσως μετά κατάλληλες μετρικές απόδοσης της λειτουργίας του μοντέλου. Κατόπιν θα περιγραφούν και θα συγκριθούν μεταγενέστερες εκδόσεις του παραδοσιακού μοντέλου GAN και νέες αλγοριθμικές τεχνικές αυτών που υποσχέθηκαν να επιλύσουν ή να βελτιώσουν μερικά από τα προβλήματα που αναγνωρίστηκαν παραπάνω ή να καλύψουν διαφορετικές λειτουργικές ανάγκες. Στο τέλος του θεωρητικού μέρους της εργασίας θα αναφερθούν κάποιες χρήσιμες εφαρμογές που βρίσκει ένα GAN μοντέλο σε διάφορους κλάδους της σύγχρονης κοινωνίας. Τέλος, στα πλαίσια του πρακτικού μέρους της παρούσας διπλωματικής εργασίας, θα υλοποιηθεί ένα CycleGAN, ένα μοντέλο GAN εξειδικευμένο στην αντιστοίχιση εικόνων από μία κατηγορία σε κάποια άλλη χωρίς να απαιτείται κάποιο σύνολο δεδομένων με έτοιμα αντιστοιχισμένα ζεύγη. Κατά την εκπαίδευση του CycleGAN και την εκτέλεση της εφαρμογής όχι μόνο να εξηγηθούν πρακτικά κάποιες από τις έννοιες που αναφέρθηκαν σε θεωρητικό επίπεδο αλλά θα εισαχθούν ως είσοδοι, θα επεξεργαστούν και ληφθούν ως έξοδοι αποτελέσματα πραγματικών δεδομένων. Με το τρόπο αυτό θα μπορέσει εν κατακλείδι να γίνει εξαγωγή χρήσιμων συμπερασμάτων σχετικά με τη τεχνολογία των GANs.
|