Διαχωρισμός και αναγνώριση ομιλίας σε περιβάλλοντα πολλαπλού θορύβου
Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9407 |
Περίληψη: | Ο διαχωρισμός ταυτόχρονης ομιλίας αποτελεί μια από τις δυσκολότερες προκλήσεις των σημερινών συστημάτων αναγνώρισης ομιλίας, ειδικά σε περιπτώσεις πολλαπλών πηγών θορύβου. Στην παρούσα εργασία εφαρμόζουμε την τεχνική της Ανάλυσης Ανεξάρτητων Συνιστωσών για τον τυφλό διαχωρισμό σημάτων ομιλίας με θόρυβο. Για την αξιολόγηση του διαχωρισμού αναπτύξαμε ένα σύστημα συνεχόμενης αναγνώρισης ομιλίας με χρήση Κρυμμένων Μοντέλων Μαρκόφ σε επίπεδο τριφώνων. Το σύστημα αναγνώρισης εκπαιδεύτηκε με εξαγωγή χαρακτηριστικών γνωρισμάτων MFCC από παραδείγματα της βάσης ακουστικών δεδομένων ΤΙΜΙΤ, μέσω του εργαλείου ΗΤΚ. Το ολοκληρωμένο σύστημα διαχωρισμού και αναγνώρισης έχει ικανοποιητική απόδοση στην περίπτωση όπου η μίξη των σημάτων γίνεται χωρίς χρονικές καθυστερήσεις. |
---|