Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου

Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Γρηγοροπούλου, Αναστασία
Άλλοι συγγραφείς:	Δερματάς, Ευάγγελος
Μορφή:	Thesis
Γλώσσα:	Greek
Έκδοση:	2016
Θέματα:	Διαχωρισμός ομιλίας Αναγνώριση ομιλίας Speech separation Speech recognition Mel-frequency cepstral coefficients (MFCCs) FastICA HTK HMM 006.454
Διαθέσιμο Online:	http://hdl.handle.net/10889/9407

Περιγραφή
Περίληψη:	Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις.

Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου

Παρόμοια τεκμήρια