Περίληψη: | Με την εξέλιξη των παραγωγικών ανταγωνιστικών δικτύων (GAN), οι συνθετικές εικόνες έχουν γίνει πιο ρεαλιστικές από ποτέ. Πλέον, ακόμα και ο πιο έμπειρος παρατηρητής μπορεί να εξαπατηθεί από τις μοντέρνες συνθετικές εικόνες, πόσο μάλλον ο ανυποψίαστος χρήστης του διαδικτύου. Αυτό ενέχει μεγάλους κινδύνους, όπως για παράδειγμα την υποκλοπή ταυτότητας και την παραπληροφόρηση. Συνεπώς, κρίνεται επιτακτική η ανάγκη για τη δημιουργία μεθόδων που είναι ικανές να ανιχνεύσουν αυτού του είδους τις συνθετικές εικόνες. Η διπλωματική εργασία αυτή επιδιώκει να επιλύσει το παραπάνω πρόβλημα, υλοποιώντας αρχικά μία μέθοδο αυτόματου διαχωρισμού φωτογραφιών από συνθετικές εικόνες προσώπων, και στη συνέχεια προσπαθώντας να τη βελτιώσει εισάγοντας πληροφορία από το βλέμμα του παρατηρητή. Αρχικά, καλύπτονται κάποιες έννοιες της επεξεργασίας εικόνας και της μηχανικής μάθησης. Έπειτα, αναλύεται η ανθρώπινη ικανότητα αναγνώρισης συνθετικών εικόνων και παρατίθενται τα αποτελέσματα μίας σχετικής μελέτης, στην οποία καταγραφόταν το βλέμμα των συμμετεχόντων όταν αυτοί κοιτούσαν μία εικόνα. Στη συνέχεια, διερευνώνται διάφορες μέθοδοι αυτόματου διαχωρισμού φωτογραφιών από συνθετικές εικόνες και υλοποιείται μία από αυτές. H μέθοδος που επιλέχθηκε βασίζεται σε ένα συνελικτικό νευρωνικό δίκτυο, το οποίο δέχεται σαν είσοδο όχι την ίδια την εικόνα, αλλά τις μήτρες συν-εμφάνισης (co-occurrence matrices) για κάθε χρωματικό κανάλι R, G και B, καθώς και τις μήτρες συν-εμφάνισης μεταξύ των ζευγών RG, RB και GB. Τέλος, γίνεται ενσωμάτωση των δεδομένων βλέμματος στο δίκτυο, υπολογίζοντας τις μήτρες συν-εμφάνισης μόνο στις περιοχές που εστίασαν περισσότερο οι παρατηρητές, και χρησιμοποιώντας αυτές για την περαιτέρω εκπαίδευση του δικτύου. Τα αποτελέσματα δείχνουν ότι η ενσωμάτωση του ανθρώπινου βλέμματος με αυτόν τον τρόπο δεν επιφέρει σημαντική αύξηση στην ακρίβεια αναγνώρισης.
|