Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού

Η επανάκαμψη των τεχνητών νευρωνικών δικτύων και ο συνδυασμός τεχνικών βαθιάς μάθησης τα τελευταία χρόνια φαίνεται να έχουν υποσχόμενα αποτελέσματα στην προσέγγιση παραδοσιακά δυσεπίλυτων προβλημάτων. Η βαθιά μάθηση βρίσκει εφαρμογή σε πολλούς τομείς των σύγχρονων επιστημών και η διασυνδεσιμότητά τη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Πουρνάρας, Ξενοφών
Άλλοι συγγραφείς: Pournaras, Xenofon
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13530
id nemertes-10889-13530
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Αναγνώριση αντικειμένων
Βαθιά μάθηση
Μηχανική μάθηση
Συνελικτικά νευρωνικά δίκτυα
Πλαίσια βαθιάς μάθησης
Βαθιά μάθηση σε φυλλομετρητή
Object detection
Deep learning
Machine learning
Convolutional neural networks
Deep learning frameworks
Object detection in browser
spellingShingle Αναγνώριση αντικειμένων
Βαθιά μάθηση
Μηχανική μάθηση
Συνελικτικά νευρωνικά δίκτυα
Πλαίσια βαθιάς μάθησης
Βαθιά μάθηση σε φυλλομετρητή
Object detection
Deep learning
Machine learning
Convolutional neural networks
Deep learning frameworks
Object detection in browser
Πουρνάρας, Ξενοφών
Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
description Η επανάκαμψη των τεχνητών νευρωνικών δικτύων και ο συνδυασμός τεχνικών βαθιάς μάθησης τα τελευταία χρόνια φαίνεται να έχουν υποσχόμενα αποτελέσματα στην προσέγγιση παραδοσιακά δυσεπίλυτων προβλημάτων. Η βαθιά μάθηση βρίσκει εφαρμογή σε πολλούς τομείς των σύγχρονων επιστημών και η διασυνδεσιμότητά της με αυτές, διευρύνει τις επιστημονικές δυνατότητες. Οι αλγόριθμοι που προτείνονται για ανάπτυξη και εκπαίδευση τέτοιων μοντέλων συνήθως απαιτούν μεγάλη υπολογιστική ισχύ που απαντάται είτε σε υπερυπολογιστές είτε σε κατανεμημένα συστήματα βελτιστοποιημένα για το σκοπό αυτό. Παρόλα αυτά πολύ πρόσφατα έχουν αρχίσει να αναδεικνύονται υλοποιήσεις και εφαρμογές, που στοχεύουν στην καθημερινή χρήση Η/Υ και συγκεκριμένα στην πλοήγηση στο Διαδίκτυο, ώστε αφενός να επιτευχθεί συγκερασμός των δυο αυτών κύριων τεχνολογικών τάσεων και αφετέρου να δοθεί μια αίσθηση ευφυίας στην εμπειρία πλοήγησης του χρήστη μέσω φυλλομετρητών και εγγενών εφαρμογών σε κινητές συσκευές. Πιο συγκεκριμένα η εμφάνιση βιβλιοθηκών που υποστηρίζουν μια πληθώρα λειτουργιών για διάφορες εργασίες βαθιάς μάθησης στον φυλλομετρητή έχει καταφέρει να δημιουργήσει ένα ευνοϊκό κλίμα για την δημιουργία τέτοιου είδους εφαρμογών στους περιηγητές με συμβατικούς υπολογιστικούς πόρους. Μια εφαρμογή της βαθιάς μάθησης που υπάγεται στον τομέα της υπολογιστικής όρασης, είναι η αναγνώριση αντικειμένων. Η βαθιά μάθηση έχει πετύχει τέτοια ακρίβεια στην ταξινόμηση και τον εντοπισμό αντικειμένων, που σε μερικές περιπτώσεις ξεπερνά την ανθρώπινη επίδοση. Με την εκτεταμένη χρήση και εκτέλεση συνελικτικών νευρωνικών δικτύων η αναγνώριση αντικειμένων είναι πλέον εφικτή και στο περιβάλλον των φυλλομετρητών. Συνεπώς, ο συνδυασμός των λειτουργιών που παρέχονται από βιβλιοθήκες βαθιάς μάθησης στους φυλλομετρητές και των δυνατοτήτων των συνελικτικών νευρωνικών δικτύων καθιστούν δυνατή την δημιουργία εφαρμογών αναγνώρισης αντικειμένων στο παραπάνω περιβάλλον. Σκοπός επομένως της διπλωματικής αυτής εργασίας, είναι η μελέτη και αξιολόγηση πλαισίων και βιβλιοθηκών για αξιοποίηση βαθιάς μάθησης στην πλευρά του φυλλομετρητή, λαμβάνοντας υπόψιν βιβλιοθήκες όπως οι TensorFlow.js, brain.js, Keras.js, ConvNet.js καθώς και άλλες. Επίσης, η διπλωματική εργασία προτείνει μια ολοκληρωμένη υλοποίηση μιας εφαρμογής αναγνώρισης αντικειμένων με διάφορες λειτουργίες που θα εκτελείται στον φυλλομετρητή του χρήστη, με την χρήση ορισμένων από τις παραπάνω βιβλιοθήκες. Στην εφαρμογή γίνεται εκτεταμένη χρήση γνωστών ανιχνευτών αντικειμένων που επιλύουν με αποδοτικό τρόπο το πρόβλημα της αναγνώρισης αντικειμένων. Παράλληλα πραγματοποιείται μια εκτενής αξιολόγηση των μοντέλων που χρησιμοποιήθηκαν, ως προς την ακρίβεια, την ταχύτητα καθώς και άλλες παραμέτρους που επηρεάζουν την απόδοση τους στο περιβάλλον του φυλλομετρητή.
author2 Pournaras, Xenofon
author_facet Pournaras, Xenofon
Πουρνάρας, Ξενοφών
author Πουρνάρας, Ξενοφών
author_sort Πουρνάρας, Ξενοφών
title Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
title_short Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
title_full Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
title_fullStr Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
title_full_unstemmed Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
title_sort αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
publishDate 2020
url http://hdl.handle.net/10889/13530
work_keys_str_mv AT pournarasxenophōn anagnōrisēantikeimenōnmechrēsētechnikōnbathiasmathēsēsseperiballonpankosmiouistou
AT pournarasxenophōn objectdetectionwiththeuseofdeeplearningtechniquesinthewebenvironment
_version_ 1771297345191804928
spelling nemertes-10889-135302022-09-05T20:24:45Z Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού Object detection with the use of deep learning techniques in the web environment Πουρνάρας, Ξενοφών Pournaras, Xenofon Αναγνώριση αντικειμένων Βαθιά μάθηση Μηχανική μάθηση Συνελικτικά νευρωνικά δίκτυα Πλαίσια βαθιάς μάθησης Βαθιά μάθηση σε φυλλομετρητή Object detection Deep learning Machine learning Convolutional neural networks Deep learning frameworks Object detection in browser Η επανάκαμψη των τεχνητών νευρωνικών δικτύων και ο συνδυασμός τεχνικών βαθιάς μάθησης τα τελευταία χρόνια φαίνεται να έχουν υποσχόμενα αποτελέσματα στην προσέγγιση παραδοσιακά δυσεπίλυτων προβλημάτων. Η βαθιά μάθηση βρίσκει εφαρμογή σε πολλούς τομείς των σύγχρονων επιστημών και η διασυνδεσιμότητά της με αυτές, διευρύνει τις επιστημονικές δυνατότητες. Οι αλγόριθμοι που προτείνονται για ανάπτυξη και εκπαίδευση τέτοιων μοντέλων συνήθως απαιτούν μεγάλη υπολογιστική ισχύ που απαντάται είτε σε υπερυπολογιστές είτε σε κατανεμημένα συστήματα βελτιστοποιημένα για το σκοπό αυτό. Παρόλα αυτά πολύ πρόσφατα έχουν αρχίσει να αναδεικνύονται υλοποιήσεις και εφαρμογές, που στοχεύουν στην καθημερινή χρήση Η/Υ και συγκεκριμένα στην πλοήγηση στο Διαδίκτυο, ώστε αφενός να επιτευχθεί συγκερασμός των δυο αυτών κύριων τεχνολογικών τάσεων και αφετέρου να δοθεί μια αίσθηση ευφυίας στην εμπειρία πλοήγησης του χρήστη μέσω φυλλομετρητών και εγγενών εφαρμογών σε κινητές συσκευές. Πιο συγκεκριμένα η εμφάνιση βιβλιοθηκών που υποστηρίζουν μια πληθώρα λειτουργιών για διάφορες εργασίες βαθιάς μάθησης στον φυλλομετρητή έχει καταφέρει να δημιουργήσει ένα ευνοϊκό κλίμα για την δημιουργία τέτοιου είδους εφαρμογών στους περιηγητές με συμβατικούς υπολογιστικούς πόρους. Μια εφαρμογή της βαθιάς μάθησης που υπάγεται στον τομέα της υπολογιστικής όρασης, είναι η αναγνώριση αντικειμένων. Η βαθιά μάθηση έχει πετύχει τέτοια ακρίβεια στην ταξινόμηση και τον εντοπισμό αντικειμένων, που σε μερικές περιπτώσεις ξεπερνά την ανθρώπινη επίδοση. Με την εκτεταμένη χρήση και εκτέλεση συνελικτικών νευρωνικών δικτύων η αναγνώριση αντικειμένων είναι πλέον εφικτή και στο περιβάλλον των φυλλομετρητών. Συνεπώς, ο συνδυασμός των λειτουργιών που παρέχονται από βιβλιοθήκες βαθιάς μάθησης στους φυλλομετρητές και των δυνατοτήτων των συνελικτικών νευρωνικών δικτύων καθιστούν δυνατή την δημιουργία εφαρμογών αναγνώρισης αντικειμένων στο παραπάνω περιβάλλον. Σκοπός επομένως της διπλωματικής αυτής εργασίας, είναι η μελέτη και αξιολόγηση πλαισίων και βιβλιοθηκών για αξιοποίηση βαθιάς μάθησης στην πλευρά του φυλλομετρητή, λαμβάνοντας υπόψιν βιβλιοθήκες όπως οι TensorFlow.js, brain.js, Keras.js, ConvNet.js καθώς και άλλες. Επίσης, η διπλωματική εργασία προτείνει μια ολοκληρωμένη υλοποίηση μιας εφαρμογής αναγνώρισης αντικειμένων με διάφορες λειτουργίες που θα εκτελείται στον φυλλομετρητή του χρήστη, με την χρήση ορισμένων από τις παραπάνω βιβλιοθήκες. Στην εφαρμογή γίνεται εκτεταμένη χρήση γνωστών ανιχνευτών αντικειμένων που επιλύουν με αποδοτικό τρόπο το πρόβλημα της αναγνώρισης αντικειμένων. Παράλληλα πραγματοποιείται μια εκτενής αξιολόγηση των μοντέλων που χρησιμοποιήθηκαν, ως προς την ακρίβεια, την ταχύτητα καθώς και άλλες παραμέτρους που επηρεάζουν την απόδοση τους στο περιβάλλον του φυλλομετρητή. The resurgence of artificial neural networks and the combination of deep learning techniques in recent years seem to have promising results in approaching traditionally intractable problems. Deep learning finds application in many fields of modern science and its interconnectivity with them expands scientific possibilities. The algorithms proposed for the development and training of such models usually require a large computational power which is found either in supercomputers or in distributed systems optimized for this purpose. However, very recently, applications and implementations aimed at everyday computer use have begun to emerge, specifically in Internet browsing, in order to achieve a combination of these two main technological trends and to give a sense of intelligence to the user's browsing experience through browsers and native applications of mobile devices. More specifically, the appearance of libraries that support a variety of functions for various deep learning tasks in the browser has managed to create a favorable climate for the creation of such applications in browsers with conventional computing resources. One deep learning application, which belongs to the field of computational vision, is object recognition. Deep learning has achieved such precision in classifying and localizing objects that in some cases exceeds human performance. With the extensive use and execution of convolutional neural networks, object recognition is now possible in the environment of browsers as well. Therefore, the combination of functions provided by deep learning libraries in the browsers and the abilities of convolutional neural networks make possible the creation of object recognition applications in the above environment. Therefore, the purpose of this dissertation is to study and evaluate frameworks and libraries for deep learning on the browser side, taking into account libraries such as TensorFlow.js, brain.js, Keras.js, ConvNet.js and others. At the same time, the dissertation proposes a prototype object recognition application with various tasks that are performed in the user's browser, using some of the above libraries. The application makes extensive use of well-known object detectors, which solve the problem of object recognition in a fast and precise way. At the same time, a complete evaluation of the models that are being used is performed, in terms of accuracy, speed and other parameters that affect their performance in the browser environment. 2020-07-12T12:47:51Z 2020-07-12T12:47:51Z 2020-06-11 http://hdl.handle.net/10889/13530 gr application/pdf winrar