Περίληψη: | Η πραγματικά μεγάλη αύξηση του όγκου πληροφοριών στον παγκόσμιο ιστό την τελευταία δεκαετία αποτελεί γεγονός, το οποίο σαφώς και είναι άμεσα συνδεδεμένο με την αλματώδη εξέλιξη της τεχνολογίας. Πληθώρα εικόνων, κειμένων και βίντεο βρίσκονται αποθηκευμένα σε βάσεις δεδομένων. Για το λόγο αυτό, αυξήθηκε η ανάγκη ανακάλυψης και εξαγωγής γνώσης απ' τα δεδομένα αυτά, που θα γίνεται αυτόματα απ' τον υπολογιστή, δηλαδή με μεθόδους Μηχανικής Μάθησης. Στην εργασία αυτή θα αναφερθούμε σε κάποιες απ' αυτές, λόγου χάρη Δέντρα απόφασης, κανόνας Bayes, κοντινότεροι γείτονες, Μηχανές διανυσμάτων υποστήριξης και φυσικά Τεχνητά νευρωνικά δίκτυα, για τα οποία θα μιλήσουμε εκτενώς.
Σε επιμέρους πεδία έρευνας της Μηχανικής Μάθησης, όπως υπολογιστική όραση, επεξεργασία φυσικής γλώσσας και αναγνώρισης ομιλίας, τα τελευταία χρόνια κυριαρχεί η Βαθιά Μάθηση. Αυτή με τη σειρά της έχει φέρει σπουδαίες ανακαλύψεις και βελτιώσεις, ωστόσο υπάρχει και δυσκολία κατανόησης ως προς τη βελτιστοποίηση και την αρχιτεκτονική βαθιών νευρωνικών δικτύων. Στην παρούσα εργασία, σκοπός μου ήταν να καλυφθεί όσο καλύτερα γίνεται το κομμάτι της Ταξινόμησης Εικόνων με χρήση Βαθιάς Μάθησης. Επομένως, γίνεται αναφορά στην έννοια της Βαθιάς Μάθησης, αναλύονται τα Συνελικτικά Νευρωνικά Δίκτυα και περιγράφονται κάποια γνωστά δίκτυα Βαθιάς Μάθησης. Στη συνέχεια αναγράφεται το πώς θα γίνει η κατασκευή ενός ταξινομητή εικόνων κι έπειτα θα περάσουμε και στην υλοποίηση με Python, δηλαδή την κατασκευή μοντέλων που θα είναι σε θέση να ταξινομούν σύνολα δεδομένων εικόνων. Συγκερκιμένα θα εξετασθούν τα σύνολα Cats and Dogs, Cifar 10 και MNIST. Τέλος, θα γίνει αναφορά και σε δύο αρχιτεκτονικές Βαθιάς Μάθησης, το RMDL και Simple Net.
|