Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning

Η υπολογιστική όραση αποτελεί τα τελευταία χρόνια , ένα από τους πιο αναπτυσσόμενους κλάδους, γνωρίζοντας σημαντική άνθιση τόσο σε ερευνητικές όσο και σε πραγματικές εφαρμογές. Αιτία είναι οι αλγόριθμοι της βαθιάς μάθησης, που θεωρούνται από πολλούς το μέλλον της τεχνητής νοημοσύνης, και σε συνδυασμ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Καραγιαννάκος, Σέργιος
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10955
id nemertes-10889-10955
record_format dspace
spelling nemertes-10889-109552022-09-05T20:22:56Z Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning Development of computer vision framework with deep learning techniques Καραγιαννάκος, Σέργιος Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Αντωνακόπουλος, Θεόδωρος Karagiannakos, Sergios Βαθιά μάθηση Παράλληλη επεξεργασία Convolutional neural network Deep learning Parallel computing 006.37 Η υπολογιστική όραση αποτελεί τα τελευταία χρόνια , ένα από τους πιο αναπτυσσόμενους κλάδους, γνωρίζοντας σημαντική άνθιση τόσο σε ερευνητικές όσο και σε πραγματικές εφαρμογές. Αιτία είναι οι αλγόριθμοι της βαθιάς μάθησης, που θεωρούνται από πολλούς το μέλλον της τεχνητής νοημοσύνης, και σε συνδυασμό με την πληθώρα των δεδομένων και την εξέλιξη των υπολογιστικών εκτίναξαν την απόδοση των συστημάτων σε πολύ υψηλά επίπεδα. Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος υπολογιστικής όρασης, που χρησιμοποιεί μεθόδους βαθιάς μηχανικής μάθησης για να αναγνωρίσει αντικείμενα σε εικόνες και να τις ταξινομήσει , με βάση το περιεχόμενο τους, σε κλάσεις. Αναλύονται και μελετώνται οι δύο βασικότερες τεχνικές βαθιάς μάθησης (deep learning), τα πλήρως συνδεδεμένα και τα συνελικτικά νευρωνικά δίκτυα , που είναι φορείς ευρείας αποδοχής από την επιστημονική κοινότητα για εφαρμογές υπολογιστικής όρασης. Παρουσιάζεται η δομή τους, οι ικανότητες τους, τα ελαττώματα τους καθώς και η διαδικασία εκπαίδευσης τους, ώστε να γίνει κατανοητός ο λόγος της υψηλής απόδοσής τους. Στη συνέχεια, περιγράφεται ο αλγόριθμος που αναπτύχθηκε, τα στάδια υλοποίησης του και διάφοροι περιορισμοί του. Το σύστημα έχει τη μορφή βιβλιοθήκης που υλοποιεί πλήρως συνδεδεμένα και βαθιά συνελικτικά δίκτυα, παρέχοντας τη δυνατότητα στο χρήστη να κατασκευάσει και να εκπαιδεύσει το δικό του δίκτυο με τις παραμέτρους της επιλογής του. Για να επιταχυνθεί η εκπαίδευση όλοι οι υπολογισμοί πραγματοποιούνται παράλληλα σε κάρτα γραφικών. Τέλος, η βιβλιοθήκη εξετάζεται σε δύο πραγματικά προβλήματα, την αναγνώριση χειρόγραφων ψηφίων και την αναγνώριση αντικειμένων, και παρουσιάζονται τα αποτελέσματα για διάφορες αρχιτεκτονικές και παραμέτρους. Computer vision has been one of the most growing industries in recent years, knowing a significant growth in both research and real-life applications. This is due to the deep learning algorithms, which are considered by many to be the future of artificial intelligence, in combination with the abundance of collected data and the evolution of computing. As a result, the performance of these applications have been improved to very high levels. This diploma thesis focuses on the development of a computer vision system that uses deep learning methods to identify objects in images and to classify them in classes based on their content. It explores and analyses the two most common deep learning techniques, fully connected and convolutional neural networks, which are widely accepted by the scientific community for computer vision applications, by their structure, abilities, defects, and their training to understand their high performance. The developed algorithm, its implementation stages, its various limitations and possible enhancements are described extensively. The system is in the form of a library that implements fully connected and deep convolutional neural networks, enabling the user to build and train their own network with parameters of their choice. To accelerate the process of training, all calculations are performed in parallel on graphics cards. Finally, the library examines two real-world problems, such as handwriting recognition and object recognition, and the results for different architectures and parameters are presented. 2018-01-17T06:29:14Z 2018-01-17T06:29:14Z 2017-10-12 Thesis http://hdl.handle.net/10889/10955 gr 6 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Βαθιά μάθηση
Παράλληλη επεξεργασία
Convolutional neural network
Deep learning
Parallel computing
006.37
spellingShingle Βαθιά μάθηση
Παράλληλη επεξεργασία
Convolutional neural network
Deep learning
Parallel computing
006.37
Καραγιαννάκος, Σέργιος
Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
description Η υπολογιστική όραση αποτελεί τα τελευταία χρόνια , ένα από τους πιο αναπτυσσόμενους κλάδους, γνωρίζοντας σημαντική άνθιση τόσο σε ερευνητικές όσο και σε πραγματικές εφαρμογές. Αιτία είναι οι αλγόριθμοι της βαθιάς μάθησης, που θεωρούνται από πολλούς το μέλλον της τεχνητής νοημοσύνης, και σε συνδυασμό με την πληθώρα των δεδομένων και την εξέλιξη των υπολογιστικών εκτίναξαν την απόδοση των συστημάτων σε πολύ υψηλά επίπεδα. Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος υπολογιστικής όρασης, που χρησιμοποιεί μεθόδους βαθιάς μηχανικής μάθησης για να αναγνωρίσει αντικείμενα σε εικόνες και να τις ταξινομήσει , με βάση το περιεχόμενο τους, σε κλάσεις. Αναλύονται και μελετώνται οι δύο βασικότερες τεχνικές βαθιάς μάθησης (deep learning), τα πλήρως συνδεδεμένα και τα συνελικτικά νευρωνικά δίκτυα , που είναι φορείς ευρείας αποδοχής από την επιστημονική κοινότητα για εφαρμογές υπολογιστικής όρασης. Παρουσιάζεται η δομή τους, οι ικανότητες τους, τα ελαττώματα τους καθώς και η διαδικασία εκπαίδευσης τους, ώστε να γίνει κατανοητός ο λόγος της υψηλής απόδοσής τους. Στη συνέχεια, περιγράφεται ο αλγόριθμος που αναπτύχθηκε, τα στάδια υλοποίησης του και διάφοροι περιορισμοί του. Το σύστημα έχει τη μορφή βιβλιοθήκης που υλοποιεί πλήρως συνδεδεμένα και βαθιά συνελικτικά δίκτυα, παρέχοντας τη δυνατότητα στο χρήστη να κατασκευάσει και να εκπαιδεύσει το δικό του δίκτυο με τις παραμέτρους της επιλογής του. Για να επιταχυνθεί η εκπαίδευση όλοι οι υπολογισμοί πραγματοποιούνται παράλληλα σε κάρτα γραφικών. Τέλος, η βιβλιοθήκη εξετάζεται σε δύο πραγματικά προβλήματα, την αναγνώριση χειρόγραφων ψηφίων και την αναγνώριση αντικειμένων, και παρουσιάζονται τα αποτελέσματα για διάφορες αρχιτεκτονικές και παραμέτρους.
author2 Δερματάς, Ευάγγελος
author_facet Δερματάς, Ευάγγελος
Καραγιαννάκος, Σέργιος
format Thesis
author Καραγιαννάκος, Σέργιος
author_sort Καραγιαννάκος, Σέργιος
title Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
title_short Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
title_full Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
title_fullStr Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
title_full_unstemmed Υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
title_sort υλοποίηση συστήματος υπολογιστικής όρασης με μεθόδους deep learning
publishDate 2018
url http://hdl.handle.net/10889/10955
work_keys_str_mv AT karagiannakossergios ylopoiēsēsystēmatosypologistikēsorasēsmemethodousdeeplearning
AT karagiannakossergios developmentofcomputervisionframeworkwithdeeplearningtechniques
_version_ 1771297273407340544