Ταξινόμηση εικόνων με βαθιά μάθηση
Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθη...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14459 |
id |
nemertes-10889-14459 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-144592022-09-05T20:43:39Z Ταξινόμηση εικόνων με βαθιά μάθηση Image classification using deep learning Μαρούντα, Αργυρώ Ελέσα Marounta, Argyro Elesa Ταξινόμηση εικόνων Βαθιά μάθηση Νευρωνικά δίκτυα Image classification Deep learning Neural networks Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης απ' τα δεδομένα αυτά, που θα γίνεται αυτόματα απ' τον υπολογιστή, δηλαδή με μεθόδους Μηχανικής Μάθησης. Στην εργασία αυτή θα αναφερθούμε σε κάποιες απ' αυτές, λόγου χάρη Δέντρα απόφασης, κανόνας Bayes, κοντινότεροι γείτονες, Μηχανές διανυσμάτων υποστήριξης και φυσικά Τεχνητά νευρωνικά δίκτυα, για τα οποία θα μιλήσουμε εκτενώς. Σε επιμέρους πεδία έρευνας της Μηχανικής Μάθησης, όπως υπολογιστική όραση, επεξεργασία φυσικής γλώσσας και αναγνώρισης ομιλίας, τα τελευταία χρόνια κυριαρχεί η Βαθιά Μάθηση. Αυτή με τη σειρά της έχει φέρει σπουδαίες ανακαλύψεις και βελτιώσεις, ωστόσο υπάρχει και δυσκολία κατανόησης ως προς τη βελτιστοποίηση και την αρχιτεκτονική βαθιών νευρωνικών δικτύων. Στην παρούσα εργασία, σκοπός μου ήταν να καλυφθεί όσο καλύτερα γίνεται το κομμάτι της Ταξινόμησης Εικόνων με χρήση Βαθιάς Μάθησης. Επομένως, γίνεται αναφορά στην έννοια της Βαθιάς Μάθησης, αναλύονται τα Συνελικτικά Νευρωνικά Δίκτυα και περιγράφονται κάποια γνωστά δίκτυα Βαθιάς Μάθησης. Στη συνέχεια αναγράφεται το πώς θα γίνει η κατασκευή ενός ταξινομητή εικόνων κι έπειτα θα περάσουμε και στην υλοποίηση με Python, δηλαδή την κατασκευή μοντέλων που θα είναι σε θέση να ταξινομούν σύνολα δεδομένων εικόνων. Συγκερκιμένα θα εξετασθούν τα σύνολα Cats and Dogs, Cifar 10 και MNIST. Τέλος, θα γίνει αναφορά και σε δύο αρχιτεκτονικές Βαθιάς Μάθησης, το RMDL και Simple Net. The enormous increase in the volume of information on the World Web in the last decade is an undeniable fact, which is directly related to the rapid development of technology. Huge amounts of images, texts and videos are stored in databases. For this reason, the need to discover and extract knowledge from this data has increased, a process that will be executed automatically by the computer, i.e. by Machine Learning methods. In this thesis we will refer to some of them, for example Decision Trees, Bayes rule, nearest neighbors, Support Vector Machines and of course Artificial Neural Networks, for which we will talk about in detail. Deep Learning has dominated in recent years in fields of research of Machine Learning, such as computer vision, natural language processing and speech recognition. Deep Learning has brought some great breakthroughs and improvements, however there is still difficulty in understanding the optimization and architecture of deep neural networks. In the present thesis, my aim was to cover as much as possible the task of Image Classification using Deep Learning. Therefore, reference is made to the concept of Deep Learning, the Convolutional Neural Networks are analyzed and some well-known Deep Learning Networks are described. After that, how to build an image classifier is explained and then follows the implementation with Python, i.e. the construction of models that will be able to classify image datasets. To be more specific, the datasets Cats and Dogs, Cifar 10 and MNIST will be examined. Finally, we present two Deep Learning architectures, RMDL and Simple Net. 2021-02-09T06:36:52Z 2021-02-09T06:36:52Z 2021-01 http://hdl.handle.net/10889/14459 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ταξινόμηση εικόνων Βαθιά μάθηση Νευρωνικά δίκτυα Image classification Deep learning Neural networks |
spellingShingle |
Ταξινόμηση εικόνων Βαθιά μάθηση Νευρωνικά δίκτυα Image classification Deep learning Neural networks Μαρούντα, Αργυρώ Ελέσα Ταξινόμηση εικόνων με βαθιά μάθηση |
description |
Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης απ' τα δεδομένα αυτά, που θα γίνεται αυτόματα απ' τον υπολογιστή, δηλαδή με μεθόδους Μηχανικής Μάθησης. Στην εργασία αυτή θα αναφερθούμε σε κάποιες απ' αυτές, λόγου χάρη Δέντρα απόφασης, κανόνας Bayes, κοντινότεροι γείτονες, Μηχανές διανυσμάτων υποστήριξης και φυσικά Τεχνητά νευρωνικά δίκτυα, για τα οποία θα μιλήσουμε εκτενώς.
Σε επιμέρους πεδία έρευνας της Μηχανικής Μάθησης, όπως υπολογιστική όραση, επεξεργασία φυσικής γλώσσας και αναγνώρισης ομιλίας, τα τελευταία χρόνια κυριαρχεί η Βαθιά Μάθηση. Αυτή με τη σειρά της έχει φέρει σπουδαίες ανακαλύψεις και βελτιώσεις, ωστόσο υπάρχει και δυσκολία κατανόησης ως προς τη βελτιστοποίηση και την αρχιτεκτονική βαθιών νευρωνικών δικτύων. Στην παρούσα εργασία, σκοπός μου ήταν να καλυφθεί όσο καλύτερα γίνεται το κομμάτι της Ταξινόμησης Εικόνων με χρήση Βαθιάς Μάθησης. Επομένως, γίνεται αναφορά στην έννοια της Βαθιάς Μάθησης, αναλύονται τα Συνελικτικά Νευρωνικά Δίκτυα και περιγράφονται κάποια γνωστά δίκτυα Βαθιάς Μάθησης. Στη συνέχεια αναγράφεται το πώς θα γίνει η κατασκευή ενός ταξινομητή εικόνων κι έπειτα θα περάσουμε και στην υλοποίηση με Python, δηλαδή την κατασκευή μοντέλων που θα είναι σε θέση να ταξινομούν σύνολα δεδομένων εικόνων. Συγκερκιμένα θα εξετασθούν τα σύνολα Cats and Dogs, Cifar 10 και MNIST. Τέλος, θα γίνει αναφορά και σε δύο αρχιτεκτονικές Βαθιάς Μάθησης, το RMDL και Simple Net. |
author2 |
Marounta, Argyro Elesa |
author_facet |
Marounta, Argyro Elesa Μαρούντα, Αργυρώ Ελέσα |
author |
Μαρούντα, Αργυρώ Ελέσα |
author_sort |
Μαρούντα, Αργυρώ Ελέσα |
title |
Ταξινόμηση εικόνων με βαθιά μάθηση |
title_short |
Ταξινόμηση εικόνων με βαθιά μάθηση |
title_full |
Ταξινόμηση εικόνων με βαθιά μάθηση |
title_fullStr |
Ταξινόμηση εικόνων με βαθιά μάθηση |
title_full_unstemmed |
Ταξινόμηση εικόνων με βαθιά μάθηση |
title_sort |
ταξινόμηση εικόνων με βαθιά μάθηση |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14459 |
work_keys_str_mv |
AT marountaargyrōelesa taxinomēsēeikonōnmebathiamathēsē AT marountaargyrōelesa imageclassificationusingdeeplearning |
_version_ |
1771297299710869504 |