Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου

Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γρηγοροπούλου, Αναστασία
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9407
id nemertes-10889-9407
record_format dspace
spelling nemertes-10889-94072022-09-05T14:00:40Z Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου Speech separation and recognition in multiple noise environments Γρηγοροπούλου, Αναστασία Δερματάς, Ευάγγελος Δερματάς, Ευάγγελος Φακωτάκης, Νίκος Grigoropoulou, Anastasia Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454 Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις. Speech separation is one of the greatest challenges of speech recognition systems, especially in case of multiple noise sources . In this project, we implement the method of Independent Component Analysis for blind separation of speech signals in the presence of noise. In order to evaluate the separation, we developed a system of continuous speech separation with the use of triphones' level Hidden Markov Models. The recognition system was trained by extracting MFCC features from TIMIT accoustic database examples, using the HTK tool. The integrated separation and recognition system has adequate efficiency provided that the signals mix is done without time delays. 2016-06-09T17:05:25Z 2016-06-09T17:05:25Z 2016-02-29 Thesis http://hdl.handle.net/10889/9407 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Διαχωρισμός ομιλίας
Αναγνώριση ομιλίας
Speech separation
Speech recognition
Mel-frequency cepstral coefficients (MFCCs)
FastICA
HTK
HMM
006.454
spellingShingle Διαχωρισμός ομιλίας
Αναγνώριση ομιλίας
Speech separation
Speech recognition
Mel-frequency cepstral coefficients (MFCCs)
FastICA
HTK
HMM
006.454
Γρηγοροπούλου, Αναστασία
Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
description Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις.
author2 Δερματάς, Ευάγγελος
author_facet Δερματάς, Ευάγγελος
Γρηγοροπούλου, Αναστασία
format Thesis
author Γρηγοροπούλου, Αναστασία
author_sort Γρηγοροπούλου, Αναστασία
title Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_short Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_full Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_fullStr Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_full_unstemmed Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
title_sort διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
publishDate 2016
url http://hdl.handle.net/10889/9407
work_keys_str_mv AT grēgoropoulouanastasia diachōrismoskaianagnōrisēomiliasseperiballontapollaplouthorybou
AT grēgoropoulouanastasia speechseparationandrecognitioninmultiplenoiseenvironments
_version_ 1771297257996419072