Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9407 |
id |
nemertes-10889-9407 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-94072022-09-05T14:00:40Z Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου Speech separation and recognition in multiple noise environments Γρηγοροπούλου, Αναστασία Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Φακωτάκης, Νίκος Grigoropoulou, Anastasia Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις. Speech separation is one of the greatest challenges of speech recognition systems, especially in case of multiple noise sources . In this project, we implement the method of Independent Component Analysis for blind separation of speech signals in the presence of noise. In order to evaluate the separation, we developed a system of continuous speech separation with the use of triphones' level Hidden Markov Models. The recognition system was trained by extracting MFCC features from TIMIT accoustic database examples, using the HTK tool. The integrated separation and recognition system has adequate efficiency provided that the signals mix is done without time delays. 2016-06-09T17:05:25Z 2016-06-09T17:05:25Z 2016-02-29 Thesis http://hdl.handle.net/10889/9407 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 |
spellingShingle |
Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 Γρηγοροπούλου, Αναστασία Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
description |
Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις. |
author2 |
Δερματάς, Ευάγγελος |
author_facet |
Δερματάς, Ευάγγελος Γρηγοροπούλου, Αναστασία |
format |
Thesis |
author |
Γρηγοροπούλου, Αναστασία |
author_sort |
Γρηγοροπούλου, Αναστασία |
title |
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
title_short |
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
title_full |
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
title_fullStr |
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
title_full_unstemmed |
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
title_sort |
διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου |
publishDate |
2016 |
url |
http://hdl.handle.net/10889/9407 |
work_keys_str_mv |
AT grēgoropoulouanastasia diachōrismoskaianagnōrisēomiliasseperiballontapollaplouthorybou AT grēgoropoulouanastasia speechseparationandrecognitioninmultiplenoiseenvironments |
_version_ |
1771297257996419072 |