Αυτόματος διαχωρισμός φωτογραφιών και γραφικών υπολογιστή με χρήση τεχνικών βαθιάς μάθησης

Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα του αυτόματου διαχωρισμού φωτογραφιών και γραφικών υπολογιστή με την χρήση τεχνικών βαθιάς μάθησης. Τα τελευταία χρόνια, η ραγδαία εξέλιξη της τεχνολογίας έχει επιφέρει πολυάριθμες θετικές επιπτώσεις στην ζωή του ανθρώπινου είδους, όμως, παράλληλα,...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αβράμης, Αλέξανδρος
Άλλοι συγγραφείς: Avramis, Alexandros
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14584
Περιγραφή
Περίληψη:Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα του αυτόματου διαχωρισμού φωτογραφιών και γραφικών υπολογιστή με την χρήση τεχνικών βαθιάς μάθησης. Τα τελευταία χρόνια, η ραγδαία εξέλιξη της τεχνολογίας έχει επιφέρει πολυάριθμες θετικές επιπτώσεις στην ζωή του ανθρώπινου είδους, όμως, παράλληλα, έχουν επέλθει και αρκετά αρνητικά φαινόμενα. Ένα από αυτά είναι κατασκευή «ψεύτικων» εικόνων, με την χρήση ηλεκτρονικών υπολογιστών, οι οποίες είναι υπερβολικά ρεαλιστικές, και είναι αδύνατο το ανθρώπινο μάτι να διακρίνει και να εντοπίσει κάποια διαφορά σε σχέση με τις αληθινές φωτογραφίες. Με την δημιουργία αληθοφανών γραφικών υπολογιστή, ενεδρεύουν διάφοροι κίνδυνοι, όπως, για παράδειγμα, είναι η υποκλοπή ταυτότητας, η παραπληροφόρηση, η χειραγώγηση κ.τ.λ. Η επιστημονική κοινότητα, και κυρίως η κοινότητα της εγκληματολογίας, καλείται να αντιμετωπίσει το πρόβλημα αυτό, και, προφανώς, να αναπτύξει κατάλληλα, αυτόματα, συστήματα που στοχεύουν στην επίλυσή του. Η σύγχρονη εξέλιξη και οι καινοτομίες στον τομέα της μηχανικής μάθησης και, συγκεκριμένα, της βαθιάς μάθησης, δίνουν την δυνατότητα ανάπτυξης τέτοιων ισχυρών συστημάτων, που είναι ικανά αντικρούσουν το πρόβλημα. Παλαιότερα, είχαν δημιουργηθεί συστήματα βασισμένα σε στατιστικά μοντέλα ή σε άλλα είδη μοντέλων, που, γενικότερα, απαιτούν πολύπλοκους υπολογισμούς. Με την χρήση των βαθιών νευρωνικών δικτύων, όλη η διαδικασία του διαχωρισμού των εικόνων, μεταξύ γραφικών υπολογιστή και φωτογραφιών, αυτοματοποιείται και απλοποιείται σε σχέση με τα ήδη υπάρχοντα συστήματα. Στην αυτή την εργασία αναπτύχθηκε το αντίστοιχο λογισμικό σε γλώσσα Python και με την χρήση των βιβλιοθηκών Tensorflow και Keras, το οποίο περιλαμβάνει την κατάλληλη προεπεξεργασία μία βάσης δεδομένων, η οποία αποτελείται από 9700 εικόνες που κατανέμονται ομοιόμορφα στις δύο κατηγορίες. Τέλος, αναπτύχθηκε κώδικας που υλοποιεί τεχνικές fine-tuning και transfer learning για την εκπαίδευση ενός residual neural network, το οποίο κατορθώνει ακρίβεια περίπου 95% και κώδικας ενός απλούστερου μοντέλου 13 επιπέδων το οποίο αγγίζει, περίπου, 86% ακρίβεια.