Περίληψη: | Η επανάκαμψη των τεχνητών νευρωνικών δικτύων και ο συνδυασμός τεχνικών βαθιάς μάθησης τα τελευταία χρόνια φαίνεται να έχουν υποσχόμενα αποτελέσματα στην προσέγγιση παραδοσιακά δυσεπίλυτων προβλημάτων. Η βαθιά μάθηση βρίσκει εφαρμογή σε πολλούς τομείς των σύγχρονων επιστημών και η διασυνδεσιμότητά της με αυτές, διευρύνει τις επιστημονικές δυνατότητες. Οι αλγόριθμοι που προτείνονται για ανάπτυξη και εκπαίδευση τέτοιων μοντέλων συνήθως απαιτούν μεγάλη υπολογιστική ισχύ που απαντάται είτε σε υπερυπολογιστές είτε σε κατανεμημένα συστήματα βελτιστοποιημένα για το σκοπό αυτό.
Παρόλα αυτά πολύ πρόσφατα έχουν αρχίσει να αναδεικνύονται υλοποιήσεις και εφαρμογές, που στοχεύουν στην καθημερινή χρήση Η/Υ και συγκεκριμένα στην πλοήγηση στο Διαδίκτυο, ώστε αφενός να επιτευχθεί συγκερασμός των δυο αυτών κύριων τεχνολογικών τάσεων και αφετέρου να δοθεί μια αίσθηση ευφυίας στην εμπειρία πλοήγησης του χρήστη μέσω φυλλομετρητών και εγγενών εφαρμογών σε κινητές συσκευές. Πιο συγκεκριμένα η εμφάνιση βιβλιοθηκών που υποστηρίζουν μια πληθώρα λειτουργιών για διάφορες εργασίες βαθιάς μάθησης στον φυλλομετρητή έχει καταφέρει να δημιουργήσει ένα ευνοϊκό κλίμα για την δημιουργία τέτοιου είδους εφαρμογών στους περιηγητές με συμβατικούς υπολογιστικούς πόρους.
Μια εφαρμογή της βαθιάς μάθησης που υπάγεται στον τομέα της υπολογιστικής όρασης, είναι η αναγνώριση αντικειμένων. Η βαθιά μάθηση έχει πετύχει τέτοια ακρίβεια στην ταξινόμηση και τον εντοπισμό αντικειμένων, που σε μερικές περιπτώσεις ξεπερνά την ανθρώπινη επίδοση. Με την εκτεταμένη χρήση και εκτέλεση συνελικτικών νευρωνικών δικτύων η αναγνώριση αντικειμένων είναι πλέον εφικτή και στο περιβάλλον των φυλλομετρητών. Συνεπώς, ο συνδυασμός των λειτουργιών που παρέχονται από βιβλιοθήκες βαθιάς μάθησης στους φυλλομετρητές και των δυνατοτήτων των συνελικτικών νευρωνικών δικτύων καθιστούν δυνατή την δημιουργία εφαρμογών αναγνώρισης αντικειμένων στο παραπάνω περιβάλλον.
Σκοπός επομένως της διπλωματικής αυτής εργασίας, είναι η μελέτη και αξιολόγηση πλαισίων και βιβλιοθηκών για αξιοποίηση βαθιάς μάθησης στην πλευρά του φυλλομετρητή, λαμβάνοντας υπόψιν βιβλιοθήκες όπως οι TensorFlow.js, brain.js, Keras.js, ConvNet.js καθώς και άλλες. Επίσης, η διπλωματική εργασία προτείνει μια ολοκληρωμένη υλοποίηση μιας εφαρμογής αναγνώρισης αντικειμένων με διάφορες λειτουργίες που θα εκτελείται στον φυλλομετρητή του χρήστη, με την χρήση ορισμένων από τις παραπάνω βιβλιοθήκες. Στην εφαρμογή γίνεται εκτεταμένη χρήση γνωστών ανιχνευτών αντικειμένων που επιλύουν με αποδοτικό τρόπο το πρόβλημα της αναγνώρισης αντικειμένων. Παράλληλα πραγματοποιείται μια εκτενής αξιολόγηση των μοντέλων που χρησιμοποιήθηκαν, ως προς την ακρίβεια, την ταχύτητα καθώς και άλλες παραμέτρους που επηρεάζουν την απόδοση τους στο περιβάλλον του φυλλομετρητή.
|