Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα, όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή, πρόβλεψη και λήψη αποφάσεων, ανάλογα...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10589 |
id |
nemertes-10889-10589 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-105892022-09-05T20:41:27Z Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας Implementation of automatic speech emotion recognition system Καραντινάκης, Στέφανος Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Karantinakis, Stefanos Αναγνώριση ομιλίας Συναίσθημα Νοημοσύνη Speech recognition Emotion Intelligence 006.4 Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα, όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή, πρόβλεψη και λήψη αποφάσεων, ανάλογα με την κατάσταση του ατόμου που αλληλοεπιδρά με το σύστημα, μεγαλώνει. Τα υπολογιστικά συστήματα, με την αναγνώριση της κατάστασης που βρίσκεται ο άνθρωπος, βελτιστοποιούν την απόκριση και πολλές φορές προσδίδουν ασφάλεια όχι μόνο στον χειριστή αλλά και στους υπόλοιπους που σχετίζονται με την εκάστοτε ενέργεια (οδηγός αυτοκινήτου/ αεροπλάνου). Την τελευταία δεκαπενταετία γίνονται έρευνες έτσι ώστε να επιτευχθεί αναγνώριση συναισθήματος του ανθρώπου από τον υπολογιστή με μια πληθώρα αλγορίθμων και μεθόδων για να υπάρξει το καλύτερο δυνατό αποτέλεσμα. Στην παρούσα διπλωματική εργασία, εξετάζονται κάποιες από αυτές τις μεθόδους και σε τελικό στάδιο ο συνδυασμός τους, δηλαδή τα μοντέλα μίξεων Γκαουσιανών κατανομών, η μέθοδος k- πλησιέστεροι γείτονες και τα πιθανοτικά νευρωνικά δίκτυα με την μέθοδο MAP(maximum a-posteriori) να συνδυάζει τους προηγούμενους αλγορίθμους μέσω ενός στοχαστικού μοντέλου έτσι ώστε να μεγιστοποιήσει την απόδοση του συστήματος. Αρχικά περιγράφεται το θεωρητικό υπόβαθρο τόσο της ομιλίας, και συγκεκριμένα των συναισθημάτων που εκπέμπονται μέσω αυτής και των χαρακτηριστικών που εξάγονται, όσο και των προαναφερθέντων αλγορίθμων. Στην συνέχεια παρατίθεται το πειραματικό μέρος της εργασίας το οποίο έχει υλοποιηθεί με την γλώσσα προγραμματισμού python και τέλος εξάγονται τα συμπεράσματα από την πειραματική διαδικασία. It is a common belief that technology has become a part of out lives and our daily routine. We interact all the time with computers and automatic systems, in our drive through, in our home, in our house. The need for recording , recognition, and decision making, whether a person who is interacting with the machine, is in a particular situation, is crucial. The computer systems, with the recognition of the status that has been found in people, optimize the response and often give safety not only to the operator but also to the others associated with the action (car driver/airplane pilot). Over the last fifteen years research has been done to achieve recognition of human emotion by the computer with a variety of algorithms and methods to give the best possible result. In this dissertation, some are being considered from these recognition algorithms and at the final stage their combination, which are the Gaussian Mixture Models, the K- Nearer Neighbors and Probabilistic Neural Networks. They are combined with the method MAP (maximum a posterior) through a stochastic model so as to Maximize system performance. At the beginning the theoretical background of both speech and its characteristics are being described as well as the aforementioned algorithms. In The experimental part of the paper, which he has been implemented with python programming language is discussed and finally the exported conclusions from the experimental process. 2017-08-25T05:52:47Z 2017-08-25T05:52:47Z 2017-07-20 Thesis http://hdl.handle.net/10889/10589 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Αναγνώριση ομιλίας Συναίσθημα Νοημοσύνη Speech recognition Emotion Intelligence 006.4 |
spellingShingle |
Αναγνώριση ομιλίας Συναίσθημα Νοημοσύνη Speech recognition Emotion Intelligence 006.4 Καραντινάκης, Στέφανος Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
description |
Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι
της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς
αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα,
όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή,
πρόβλεψη και λήψη αποφάσεων, ανάλογα με την κατάσταση του ατόμου
που αλληλοεπιδρά με το σύστημα, μεγαλώνει. Τα υπολογιστικά
συστήματα, με την αναγνώριση της κατάστασης που βρίσκεται ο
άνθρωπος, βελτιστοποιούν την απόκριση και πολλές φορές προσδίδουν
ασφάλεια όχι μόνο στον χειριστή αλλά και στους υπόλοιπους που
σχετίζονται με την εκάστοτε ενέργεια (οδηγός αυτοκινήτου/ αεροπλάνου).
Την τελευταία δεκαπενταετία γίνονται έρευνες έτσι ώστε να επιτευχθεί
αναγνώριση συναισθήματος του ανθρώπου από τον υπολογιστή με μια
πληθώρα αλγορίθμων και μεθόδων για να υπάρξει το καλύτερο δυνατό
αποτέλεσμα. Στην παρούσα διπλωματική εργασία, εξετάζονται κάποιες
από αυτές τις μεθόδους και σε τελικό στάδιο ο συνδυασμός τους,
δηλαδή τα μοντέλα μίξεων Γκαουσιανών κατανομών, η μέθοδος k-
πλησιέστεροι γείτονες και τα πιθανοτικά νευρωνικά δίκτυα με την μέθοδο
MAP(maximum a-posteriori) να συνδυάζει τους προηγούμενους
αλγορίθμους μέσω ενός στοχαστικού μοντέλου έτσι ώστε να
μεγιστοποιήσει την απόδοση του συστήματος. Αρχικά περιγράφεται το
θεωρητικό υπόβαθρο τόσο της ομιλίας, και συγκεκριμένα των
συναισθημάτων που εκπέμπονται μέσω αυτής και των χαρακτηριστικών
που εξάγονται, όσο και των προαναφερθέντων αλγορίθμων. Στην
συνέχεια παρατίθεται το πειραματικό μέρος της εργασίας το οποίο έχει
υλοποιηθεί με την γλώσσα προγραμματισμού python και τέλος εξάγονται
τα συμπεράσματα από την πειραματική διαδικασία. |
author2 |
Δερματάς, Ευάγγελος |
author_facet |
Δερματάς, Ευάγγελος Καραντινάκης, Στέφανος |
format |
Thesis |
author |
Καραντινάκης, Στέφανος |
author_sort |
Καραντινάκης, Στέφανος |
title |
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
title_short |
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
title_full |
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
title_fullStr |
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
title_full_unstemmed |
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
title_sort |
υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας |
publishDate |
2017 |
url |
http://hdl.handle.net/10889/10589 |
work_keys_str_mv |
AT karantinakēsstephanos ylopoiēsēautomatousystēmatosanagnōrisēssynaisthēmatōnmesōomilias AT karantinakēsstephanos implementationofautomaticspeechemotionrecognitionsystem |
_version_ |
1771297273376931840 |