Περίληψη: | Η παρούσα διπλωματική εργασία ασχολείται με τον κλάδο της Βαθιάς Μάθησης και συγκεκριμένα με την επεξεργασία τρισδιάστατων δεδομένων. Σκοπός είναι η υλοποίηση ενός μοντέλου τρισδιάστατης ταξινόμησης αντικειμένων, σε μορφή νέφους σημείων, με πρωτότυπο αλλά αποδοτικό τρόπο. Τα αποτελέσματα είναι άμεσα συγκρίσιμα με ήδη εφαρμόσιμες υλοποιήσεις, οι οποίες ωστόσο απαιτούν πολύ μεγάλη υπολογιστική ισχύ και έχουν ιδιαίτερα μεγάλη πολυπλοκότητα κατά το σχεδιασμό. Με βάση το μοντέλο του PointNet, του οποίου η αρχιτεκτονική και προσέγγιση χρησιμοποιείται, σχεδιάζεται ένα δίκτυο τρισδιάστατης ταξινόμησης. Αρχικά, φορτώνονται τα δεδομένα, δέχονται κατάληλλη προεπεξεργασία και δημιουργούνται τα κατάλληλα σύνολα για την εκπαίδευση και την αξιολόγηση του μοντέλου. Στη συνέχεια, δημιουργείται το μοντέλο, το οποίο δεχόμενο αντικείμενα σε μορφή νέφους σημείων, απδοδίδει τελικά προβλέψεις για την κατηγορία στην οποία αυτά ανήκουν, με δημιουργία ξεχωριστής κλάσης για την προσθήκη ανοχής αντιμεταθέσεων των σημείων, από το δίκτυο. Ορίζοντας παραμέτρους όπως η απώλεια και ο αλγόριθμος βελτιστοποίησης εκπαιδεύουμε το μοντέλο για σύνολο 80 εποχών, δημιουργώντας έναν αποδοτικό και ακριβή ταξινομητή για τρισδιάστατα αντικείμενα.
Η υλοποίηση του μοντέλου έγινε με χρήση της γλώσσας προγραμματισμού Python, ενώ η ανάπτυξη και ο σχεδιασμός του δικτύου βασίστηκε στη βιβλιοθήκη TensorFlow. Τέλος για την εκπαίδευση του μοντέλου αλλά και την αποδοτικότερη υλοποίηση με χρήση ισχυρών cloud καρτών γραφικών, χρησιμοποιήθηκε ο διαδικτυακός editor, Kaggle Notebooks.
|