Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας

Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα, όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή, πρόβλεψη και λήψη αποφάσεων, ανάλογα...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Καραντινάκης, Στέφανος
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10589
id nemertes-10889-10589
record_format dspace
spelling nemertes-10889-105892022-09-05T20:41:27Z Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας Implementation of automatic speech emotion recognition system Καραντινάκης, Στέφανος Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Karantinakis, Stefanos Αναγνώριση ομιλίας Συναίσθημα Νοημοσύνη Speech recognition Emotion Intelligence 006.4 Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα, όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή, πρόβλεψη και λήψη αποφάσεων, ανάλογα με την κατάσταση του ατόμου που αλληλοεπιδρά με το σύστημα, μεγαλώνει. Τα υπολογιστικά συστήματα, με την αναγνώριση της κατάστασης που βρίσκεται ο άνθρωπος, βελτιστοποιούν την απόκριση και πολλές φορές προσδίδουν ασφάλεια όχι μόνο στον χειριστή αλλά και στους υπόλοιπους που σχετίζονται με την εκάστοτε ενέργεια (οδηγός αυτοκινήτου/ αεροπλάνου). Την τελευταία δεκαπενταετία γίνονται έρευνες έτσι ώστε να επιτευχθεί αναγνώριση συναισθήματος του ανθρώπου από τον υπολογιστή με μια πληθώρα αλγορίθμων και μεθόδων για να υπάρξει το καλύτερο δυνατό αποτέλεσμα. Στην παρούσα διπλωματική εργασία, εξετάζονται κάποιες από αυτές τις μεθόδους και σε τελικό στάδιο ο συνδυασμός τους, δηλαδή τα μοντέλα μίξεων Γκαουσιανών κατανομών, η μέθοδος k- πλησιέστεροι γείτονες και τα πιθανοτικά νευρωνικά δίκτυα με την μέθοδο MAP(maximum a-posteriori) να συνδυάζει τους προηγούμενους αλγορίθμους μέσω ενός στοχαστικού μοντέλου έτσι ώστε να μεγιστοποιήσει την απόδοση του συστήματος. Αρχικά περιγράφεται το θεωρητικό υπόβαθρο τόσο της ομιλίας, και συγκεκριμένα των συναισθημάτων που εκπέμπονται μέσω αυτής και των χαρακτηριστικών που εξάγονται, όσο και των προαναφερθέντων αλγορίθμων. Στην συνέχεια παρατίθεται το πειραματικό μέρος της εργασίας το οποίο έχει υλοποιηθεί με την γλώσσα προγραμματισμού python και τέλος εξάγονται τα συμπεράσματα από την πειραματική διαδικασία. It is a common belief that technology has become a part of out lives and our daily routine. We interact all the time with computers and automatic systems, in our drive through, in our home, in our house. The need for recording , recognition, and decision making, whether a person who is interacting with the machine, is in a particular situation, is crucial. The computer systems, with the recognition of the status that has been found in people, optimize the response and often give safety not only to the operator but also to the others associated with the action (car driver/airplane pilot). Over the last fifteen years research has been done to achieve recognition of human emotion by the computer with a variety of algorithms and methods to give the best possible result. In this dissertation, some are being considered from these recognition algorithms and at the final stage their combination, which are the Gaussian Mixture Models, the K- Nearer Neighbors and Probabilistic Neural Networks. They are combined with the method MAP (maximum a posterior) through a stochastic model so as to Maximize system performance. At the beginning the theoretical background of both speech and its characteristics are being described as well as the aforementioned algorithms. In The experimental part of the paper, which he has been implemented with python programming language is discussed and finally the exported conclusions from the experimental process. 2017-08-25T05:52:47Z 2017-08-25T05:52:47Z 2017-07-20 Thesis http://hdl.handle.net/10889/10589 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Αναγνώριση ομιλίας
Συναίσθημα
Νοημοσύνη
Speech recognition
Emotion
Intelligence
006.4
spellingShingle Αναγνώριση ομιλίας
Συναίσθημα
Νοημοσύνη
Speech recognition
Emotion
Intelligence
006.4
Καραντινάκης, Στέφανος
Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
description Είναι κοινή ομολογία ότι η τεχνολογία έχει γίνει αναπόσπαστο κομμάτι της ζωής μας και εν γένει της καθημερινότητάς μας. Συνεχώς αλληλεπιδρούμε με υπολογιστές και αυτοματοποιημένα συστήματα, όπως στο αυτοκίνητο, στην δουλειά, στο σπίτι. Η ανάγκη για καταγραφή, πρόβλεψη και λήψη αποφάσεων, ανάλογα με την κατάσταση του ατόμου που αλληλοεπιδρά με το σύστημα, μεγαλώνει. Τα υπολογιστικά συστήματα, με την αναγνώριση της κατάστασης που βρίσκεται ο άνθρωπος, βελτιστοποιούν την απόκριση και πολλές φορές προσδίδουν ασφάλεια όχι μόνο στον χειριστή αλλά και στους υπόλοιπους που σχετίζονται με την εκάστοτε ενέργεια (οδηγός αυτοκινήτου/ αεροπλάνου). Την τελευταία δεκαπενταετία γίνονται έρευνες έτσι ώστε να επιτευχθεί αναγνώριση συναισθήματος του ανθρώπου από τον υπολογιστή με μια πληθώρα αλγορίθμων και μεθόδων για να υπάρξει το καλύτερο δυνατό αποτέλεσμα. Στην παρούσα διπλωματική εργασία, εξετάζονται κάποιες από αυτές τις μεθόδους και σε τελικό στάδιο ο συνδυασμός τους, δηλαδή τα μοντέλα μίξεων Γκαουσιανών κατανομών, η μέθοδος k- πλησιέστεροι γείτονες και τα πιθανοτικά νευρωνικά δίκτυα με την μέθοδο MAP(maximum a-posteriori) να συνδυάζει τους προηγούμενους αλγορίθμους μέσω ενός στοχαστικού μοντέλου έτσι ώστε να μεγιστοποιήσει την απόδοση του συστήματος. Αρχικά περιγράφεται το θεωρητικό υπόβαθρο τόσο της ομιλίας, και συγκεκριμένα των συναισθημάτων που εκπέμπονται μέσω αυτής και των χαρακτηριστικών που εξάγονται, όσο και των προαναφερθέντων αλγορίθμων. Στην συνέχεια παρατίθεται το πειραματικό μέρος της εργασίας το οποίο έχει υλοποιηθεί με την γλώσσα προγραμματισμού python και τέλος εξάγονται τα συμπεράσματα από την πειραματική διαδικασία.
author2 Δερματάς, Ευάγγελος
author_facet Δερματάς, Ευάγγελος
Καραντινάκης, Στέφανος
format Thesis
author Καραντινάκης, Στέφανος
author_sort Καραντινάκης, Στέφανος
title Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
title_short Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
title_full Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
title_fullStr Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
title_full_unstemmed Υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
title_sort υλοποίηση αυτόματου συστήματος αναγνώρισης συναισθημάτων μέσω ομιλίας
publishDate 2017
url http://hdl.handle.net/10889/10589
work_keys_str_mv AT karantinakēsstephanos ylopoiēsēautomatousystēmatosanagnōrisēssynaisthēmatōnmesōomilias
AT karantinakēsstephanos implementationofautomaticspeechemotionrecognitionsystem
_version_ 1771297273376931840