Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας

Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μπίτζας, Δημήτρης
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10585
Περιγραφή
Περίληψη:Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας.