| Περίληψη: | Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι
της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς
αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα,
όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή,
πρόβλεψη και λήψη αποφάσεων, ανάλογα με την κατάσταση του ατόμου
που αλληλοεπιδρά με το σύστημα, μεγαλώνει. Τα υπολογιστικά
συστήματα, με την αναγνώριση της κατάστασης που βρίσκεται ο
άνθρωπος, βελτιστοποιούν την απόκριση και πολλές φορές προσδίδουν
ασφάλεια όχι μόνο στον χειριστή αλλά και στους υπόλοιπους που
σχετίζονται με την εκάστοτε ενέργεια (οδηγός αυτοκινήτου/ αεροπλάνου).
Την τελευταία δεκαπενταετία γίνονται έρευνες έτσι ώστε να επιτευχθεί
αναγνώριση συναισθήματος του ανθρώπου από τον υπολογιστή με μια
πληθώρα αλγορίθμων και μεθόδων για να υπάρξει το καλύτερο δυνατό
αποτέλεσμα. Στην παρούσα διπλωματική εργασία, εξετάζονται κάποιες
από αυτές τις μεθόδους και σε τελικό στάδιο ο συνδυασμός τους,
δηλαδή τα μοντέλα μίξεων Γκαουσιανών κατανομών, η μέθοδος k-
πλησιέστεροι γείτονες και τα πιθανοτικά νευρωνικά δίκτυα με την μέθοδο
MAP(maximum a-posteriori) να συνδυάζει τους προηγούμενους
αλγορίθμους μέσω ενός στοχαστικού μοντέλου έτσι ώστε να
μεγιστοποιήσει την απόδοση του συστήματος. Αρχικά περιγράφεται το
θεωρητικό υπόβαθρο τόσο της ομιλίας, και συγκεκριμένα των
συναισθημάτων που εκπέμπονται μέσω αυτής και των χαρακτηριστικών
που εξάγονται, όσο και των προαναφερθέντων αλγορίθμων. Στην
συνέχεια παρατίθεται το πειραματικό μέρος της εργασίας το οποίο έχει
υλοποιηθεί με την γλώσσα προγραμματισμού python και τέλος εξάγονται
τα συμπεράσματα από την πειραματική διαδικασία.
|