Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10585 |
Περίληψη: | Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας. |
---|