Summary: | Στη παρούσα διπλωματική εργασία έγινε μια προσπάθεια εφαρμογής μεθόδων βαθιάς μάθησης για την αναγνώριση ανθρώπινων δραστηριοτήτων καθημερινής ζωής. Το πρόβλημα ανήκει στο ευρύτερο πεδίο της αναγνώρισης μοτίβων και, πιο συγκεκριμένα, αποτελεί ένα πρόβλημα κατηγοριοποίησης πολλαπλών κλάσεων. Το σύνολο δεδομένων που χρησιμοποιήθηκε για τις ανάγκες της εργασίας περιέχει καταγραφές από ένα μεγάλο πλήθος αισθητήρων διαφόρων τύπων, οι οποίες έχουν διεξαχθεί κατά τη διάρκεια εξομοίωσης ενός σεναρίου πρωινού γεύματος. Η διεξαγωγή της εξομοίωσης είχε στόχο την επίτευξη φυσικότητας όσον αφορά τις ενέργειες και δραστηριότητες των εθελοντών, ενώ η διαδικασία της καταγραφής επιδίωκε την προσέγγιση ρεαλιστικών συνθηκών καταγραφής.
Τα μοντέλα που αναπτύχθηκαν στα πλαίσια της εργασίας αποτελούν καταρχάς νευρωνικά δίκτυα μακράς βραχυπρόθεσμης μνήμης, ή αλλιώς LSTM, τα οποία ανήκουν στη κατηγορία των επαναληπτικών δικτύων. Το δεύτερο είδος μοντέλων που αναπτύχθηκε βασίζεται σε ένα συνδυαστικό μοντέλο μηχανικής μάθησης που ονομάζεται Ensemble. Τα συνδυαστικό αυτά μοντέλα που δημιουργήθηκαν αποτελούνται εν μέρη από υποσύνολα των LSTM μοντέλων που αναπτύχθηκαν. Με την ολοκλήρωση της υλοποίησης και την εξαγωγή των αποτελεσμάτων μπορέσαμε στη συνέχεια να συγκρίνουμε τις μεθόδους και να βγάλουμε συμπεράσματα σχετικά με την εκπαίδευση αλλά και την εφαρμογή τους στο πρόβλημα της αναγνώρισης ανθρώπινης δραστηριότητας.
Η υλοποίηση έγινε σε Python με τη βοήθεια της βιβλιοθήκης μηχανικής μάθησης PyTorch, ενώ τα μοντέλα εκπαιδεύτηκαν και τρέξανε σε επιταχυντές γραφικών της Nvidia.
|