Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου

Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Γρηγοροπούλου, Αναστασία
Άλλοι συγγραφείς:	Δερματάς, Ευάγγελος
Μορφή:	Thesis
Γλώσσα:	Greek
Έκδοση:	2016
Θέματα:	Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454
Διαθέσιμο Online:	http://hdl.handle.net/10889/9407

id	nemertes-10889-9407
record_format	dspace
spelling	nemertes-10889-94072022-09-05T14:00:40Z Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου Speech separation and recognition in multiple noise environments Γρηγοροπούλου, Αναστασία Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Φακωτάκης, Νίκος Grigoropoulou, Anastasia Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις. Speech separation is one of the greatest challenges of speech recognition systems, especially in case of multiple noise sources . In this project, we implement the method of Independent Component Analysis for blind separation of speech signals in the presence of noise. In order to evaluate the separation, we developed a system of continuous speech separation with the use of triphones' level Hidden Markov Models. The recognition system was trained by extracting MFCC features from TIMIT accoustic database examples, using the HTK tool. The integrated separation and recognition system has adequate efficiency provided that the signals mix is done without time delays. 2016-06-09T17:05:25Z 2016-06-09T17:05:25Z 2016-02-29 Thesis http://hdl.handle.net/10889/9407 gr 0 application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454
spellingShingle	Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 Γρηγοροπούλου, Αναστασία Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
description	Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις.
author2	Δερματάς, Ευάγγελος
author_facet	Δερματάς, Ευάγγελος Γρηγοροπούλου, Αναστασία
format	Thesis
author	Γρηγοροπούλου, Αναστασία
author_sort	Γρηγοροπούλου, Αναστασία
title	Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_short	Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_full	Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_fullStr	Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_full_unstemmed	Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_sort	διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
publishDate	2016
url	http://hdl.handle.net/10889/9407
work_keys_str_mv	AT grēgoropoulouanastasia diachōrismoskaianagnōrisēomiliasseperiballontapollaplouthorybou AT grēgoropoulouanastasia speechseparationandrecognitioninmultiplenoiseenvironments
_version_	1771297257996419072

Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου

Παρόμοια τεκμήρια