Περίληψη: | Η παρούσα διπλωματική εστιάζει στη θεματική περιοχή του object detection η οποία αποτελεί μέρος του ευρύτερου πεδίου του computer vision και συνδυάζει τεχνικές επεξεργασίας εικόνας (image processing). Με τη βοήθεια του object detection είμαστε σε θέση να εντοπίσουμε την ύπαρξη συγκεκριμένων αντικειμένων όπως ανθρώπους, αυτοκίνητα, κτήρια κ.α. εντός ψηφιακών εικόνων ή βίντεο. Πιο συγκεκριμένα εστιάζουμε στην χρήση ενσωματωμένων καμερών που φέρουν αυτοκίνητα με δυνατότητες αυτόνομης οδήγησης και αναγνώρισης πεζών.
Η παραπάνω μελέτη θα βασιστεί σε τεχνικές νευρωνικών δικτύων deep learning ώστε να αντιμετωπιστούν τα προβλήματα object detection και localization. Τα εν λόγω συνελικτικά (convolution) νευρωνικά δίκτυα γνωστά ως MobileNet, που θα χρησιμοποιηθούν χρειάζεται να έχουν αρχιτεκτονική κατάλληλα προσαρμοσμένη για mobile και embedded εφαρμογές. Πράγμα που σημαίνει μειωμένο μέγεθος, ταχύτητα χωρίς ιδιαίτερες εκπτώσεις στην ακρίβεια (accuracy). Έχοντας πετύχει το classification με τα νευρωνικά δίκτυα που ανήκουν στην οικογένεια των MobileNet θα κάνουμε χρήση του Single Shot MultiBox Detector (SSD) για τον εντοπισμό (detection task). Ο συνδυασμός αυτών των δυο αναμένεται να δώσει ικανοποιητικά αποτέλεσμα στον εντοπισμό αυτοκινήτων και πεζών. Στη συνέχεια θα γίνει προσπάθεια εισαγωγής της παραπάνω υλοποίησης σε μία embedded συσκευή (raspberry pi) με σοβαρούς περιορισμούς σε υπολογιστικούς και αποθηκευτικούς πόρους ώστε να αξιολογηθεί περαιτέρω.
Πέραν των προαναφερόμενων τεχνικών θα παρουσιαστούν και τα εργαλεία και συσκευές που θα χρησιμοποιηθούν για την υλοποίηση της εργασίας.
|