Ταξινόμηση εικόνων με βαθιά μάθηση

Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μαρούντα, Αργυρώ Ελέσα
Άλλοι συγγραφείς: Marounta, Argyro Elesa
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14459
id nemertes-10889-14459
record_format dspace
spelling nemertes-10889-144592022-09-05T20:43:39Z Ταξινόμηση εικόνων με βαθιά μάθηση Image classification using deep learning Μαρούντα, Αργυρώ Ελέσα Marounta, Argyro Elesa Ταξινόμηση εικόνων Βαθιά μάθηση Νευρωνικά δίκτυα Image classification Deep learning Neural networks Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης απ' τα δεδομένα αυτά, που θα γίνεται αυτόματα απ' τον υπολογιστή, δηλαδή με μεθόδους Μηχανικής Μάθησης. Στην εργασία αυτή θα αναφερθούμε σε κάποιες απ' αυτές, λόγου χάρη Δέντρα απόφασης, κανόνας Bayes, κοντινότεροι γείτονες, Μηχανές διανυσμάτων υποστήριξης και φυσικά Τεχνητά νευρωνικά δίκτυα, για τα οποία θα μιλήσουμε εκτενώς. Σε επιμέρους πεδία έρευνας της Μηχανικής Μάθησης, όπως υπολογιστική όραση, επεξεργασία φυσικής γλώσσας και αναγνώρισης ομιλίας, τα τελευταία χρόνια κυριαρχεί η Βαθιά Μάθηση. Αυτή με τη σειρά της έχει φέρει σπουδαίες ανακαλύψεις και βελτιώσεις, ωστόσο υπάρχει και δυσκολία κατανόησης ως προς τη βελτιστοποίηση και την αρχιτεκτονική βαθιών νευρωνικών δικτύων. Στην παρούσα εργασία, σκοπός μου ήταν να καλυφθεί όσο καλύτερα γίνεται το κομμάτι της Ταξινόμησης Εικόνων με χρήση Βαθιάς Μάθησης. Επομένως, γίνεται αναφορά στην έννοια της Βαθιάς Μάθησης, αναλύονται τα Συνελικτικά Νευρωνικά Δίκτυα και περιγράφονται κάποια γνωστά δίκτυα Βαθιάς Μάθησης. Στη συνέχεια αναγράφεται το πώς θα γίνει η κατασκευή ενός ταξινομητή εικόνων κι έπειτα θα περάσουμε και στην υλοποίηση με Python, δηλαδή την κατασκευή μοντέλων που θα είναι σε θέση να ταξινομούν σύνολα δεδομένων εικόνων. Συγκερκιμένα θα εξετασθούν τα σύνολα Cats and Dogs, Cifar 10 και MNIST. Τέλος, θα γίνει αναφορά και σε δύο αρχιτεκτονικές Βαθιάς Μάθησης, το RMDL και Simple Net. The enormous increase in the volume of information on the World Web in the last decade is an undeniable fact, which is directly related to the rapid development of technology. Huge amounts of images, texts and videos are stored in databases. For this reason, the need to discover and extract knowledge from this data has increased, a process that will be executed automatically by the computer, i.e. by Machine Learning methods. In this thesis we will refer to some of them, for example Decision Trees, Bayes rule, nearest neighbors, Support Vector Machines and of course Artificial Neural Networks, for which we will talk about in detail. Deep Learning has dominated in recent years in fields of research of Machine Learning, such as computer vision, natural language processing and speech recognition. Deep Learning has brought some great breakthroughs and improvements, however there is still difficulty in understanding the optimization and architecture of deep neural networks. In the present thesis, my aim was to cover as much as possible the task of Image Classification using Deep Learning. Therefore, reference is made to the concept of Deep Learning, the Convolutional Neural Networks are analyzed and some well-known Deep Learning Networks are described. After that, how to build an image classifier is explained and then follows the implementation with Python, i.e. the construction of models that will be able to classify image datasets. To be more specific, the datasets Cats and Dogs, Cifar 10 and MNIST will be examined. Finally, we present two Deep Learning architectures, RMDL and Simple Net. 2021-02-09T06:36:52Z 2021-02-09T06:36:52Z 2021-01 http://hdl.handle.net/10889/14459 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ταξινόμηση εικόνων
Βαθιά μάθηση
Νευρωνικά δίκτυα
Image classification
Deep learning
Neural networks
spellingShingle Ταξινόμηση εικόνων
Βαθιά μάθηση
Νευρωνικά δίκτυα
Image classification
Deep learning
Neural networks
Μαρούντα, Αργυρώ Ελέσα
Ταξινόμηση εικόνων με βαθιά μάθηση
description Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης απ' τα δεδομένα αυτά, που θα γίνεται αυτόματα απ' τον υπολογιστή, δηλαδή με μεθόδους Μηχανικής Μάθησης. Στην εργασία αυτή θα αναφερθούμε σε κάποιες απ' αυτές, λόγου χάρη Δέντρα απόφασης, κανόνας Bayes, κοντινότεροι γείτονες, Μηχανές διανυσμάτων υποστήριξης και φυσικά Τεχνητά νευρωνικά δίκτυα, για τα οποία θα μιλήσουμε εκτενώς. Σε επιμέρους πεδία έρευνας της Μηχανικής Μάθησης, όπως υπολογιστική όραση, επεξεργασία φυσικής γλώσσας και αναγνώρισης ομιλίας, τα τελευταία χρόνια κυριαρχεί η Βαθιά Μάθηση. Αυτή με τη σειρά της έχει φέρει σπουδαίες ανακαλύψεις και βελτιώσεις, ωστόσο υπάρχει και δυσκολία κατανόησης ως προς τη βελτιστοποίηση και την αρχιτεκτονική βαθιών νευρωνικών δικτύων. Στην παρούσα εργασία, σκοπός μου ήταν να καλυφθεί όσο καλύτερα γίνεται το κομμάτι της Ταξινόμησης Εικόνων με χρήση Βαθιάς Μάθησης. Επομένως, γίνεται αναφορά στην έννοια της Βαθιάς Μάθησης, αναλύονται τα Συνελικτικά Νευρωνικά Δίκτυα και περιγράφονται κάποια γνωστά δίκτυα Βαθιάς Μάθησης. Στη συνέχεια αναγράφεται το πώς θα γίνει η κατασκευή ενός ταξινομητή εικόνων κι έπειτα θα περάσουμε και στην υλοποίηση με Python, δηλαδή την κατασκευή μοντέλων που θα είναι σε θέση να ταξινομούν σύνολα δεδομένων εικόνων. Συγκερκιμένα θα εξετασθούν τα σύνολα Cats and Dogs, Cifar 10 και MNIST. Τέλος, θα γίνει αναφορά και σε δύο αρχιτεκτονικές Βαθιάς Μάθησης, το RMDL και Simple Net.
author2 Marounta, Argyro Elesa
author_facet Marounta, Argyro Elesa
Μαρούντα, Αργυρώ Ελέσα
author Μαρούντα, Αργυρώ Ελέσα
author_sort Μαρούντα, Αργυρώ Ελέσα
title Ταξινόμηση εικόνων με βαθιά μάθηση
title_short Ταξινόμηση εικόνων με βαθιά μάθηση
title_full Ταξινόμηση εικόνων με βαθιά μάθηση
title_fullStr Ταξινόμηση εικόνων με βαθιά μάθηση
title_full_unstemmed Ταξινόμηση εικόνων με βαθιά μάθηση
title_sort ταξινόμηση εικόνων με βαθιά μάθηση
publishDate 2021
url http://hdl.handle.net/10889/14459
work_keys_str_mv AT marountaargyrōelesa taxinomēsēeikonōnmebathiamathēsē
AT marountaargyrōelesa imageclassificationusingdeeplearning
_version_ 1771297299710869504