Περίληψη: | Ο σκοπός της παρούσας διπλωματικής εργασίας είναι να διερευνήσει και αν είναι δυνατόν να αποκρυπτογραφήσει με τη βοήθεια της μηχανικής μάθησης, την τεχνολογία του διαδεδομένου τεστ Captcha. Τo Captcha με το ακρωνύμιο Completely Automated Public Turing test to tell Computers and Humans Apart, περιγράφει ένα είδος αυτόματου τεστ διαδικτυακής αναγνώρισης του χρήστη, με στόχο να εξετάσει αν πρόκειται για δράση πραγματικού ανθρώπου ή για κάποια υπολογιστική δράση. Συνηθίζεται τα captcha τεστ να εμφανίζονται στο διαδίκτυο στο κάτω μέρος μιας φόρμας επικοινωνίας, ως ένα τεστ με παραμορφωμένες εικόνες γραμμάτων και αριθμών σε διάφορα μεγέθη και χρώματα, όπου ζητείται από τον χρήστη να διαβάσει με το ανθρώπινο μάτι το συνδυασμό των γραμμάτων και αριθμών που βλέπει στην οθόνη, να τα πληκτρολογήσει σωστά και να τα αποστείλει, επιβεβαιώνοντας με αυτό τον τρόπο οτι πρόκειται για πραγματική ανθρώπινη νοημοσύνη.
Στην παρούσα διπλωματική εργασία θα διερευνήσουμε λεπτομερώς τον τρόπο λειτουργίας του Captcha, με στόχο δυνατότητα που έχουν 2 μοντέλα μηχανικής μάθησης: α. τα νευρωνικά δίκτυα και β. οι μηχανές διανυσμάτων υποστήριξης να ξεπεράσουν την ανθρώπινη νοημοσύνη και ικανότητα να συμπληρώνουν σωστά τα Captcha test. Η μεθοδολογία που θα ακολουθήσουμε είναι αρχικά η έρευνα και η αναζήτηση της χρησιμότητας των Captcha τεστ. Στη συνέχεια, θα εστιάσουμε σε θεμελιώδεις έννοιες νευρωνικών δικτύων και μηχανών διανυσμάτων υποστήριξης σχετικά με τον τρόπο που διαχειρίζονται προβλήματα ταξινόμησης, όπως της συνήθης πρακτικής των προβλημάτων Captcha. Τέλος, με τη μέθοδο σύγκρισης θα βγάλουμε συμπεράσματα για τα 2 μοντέλα και τη δυνατότητά τους να προσομοιάσουν μια ανθρώπινη ικανότητα αναγνώρισης χαρακτήρων του Captcha.
Από αυτή την παραπάνω πειραματική διαδικασία, στα πλαίσια της παρούσης διπλωματικής εργασίας, διαπιστώνεται ότι το μοντέλο νευρωνικών δικτύων υπερτερεί σε ακρίβεια, ενώ το μοντέλο μηχανών διανυσμάτων υποστήριξης είναι συντριπτικά ανώτερο στο χρόνο που απαιτείται για την εκπαίδευσή του.
|