Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10585 |
id |
nemertes-10889-10585 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-105852022-09-05T05:00:32Z Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας Development of speech recognition system on parallel computing machines Μπίτζας, Δημήτρης Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Bitzas, Dimitris Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας. The objective of this thesis is the development of an Automated Speech Recognition (ASR) system based on the combination of Hidden Markov Model (HMM) and Gaussian Mixture Model (GMM). Mel-frequency Cepstral Coefficients (MFCCs) were used to encode the parameters of speech. Both Central Process Unit (CPU) serialized execution and Graphics Process Unit (GPU) parallel execution, were implemented. The system was developed with the programming language C++ and its Graphical User Interface (GUI) was created with the IDE QT. Parallel programming implemented with the use of OpenCL framework. Finally, comparisons of serial and parallel executions are presented in the results section in order to evaluate the use of parallel programming in Speech Recognition applications. 2017-08-25T05:41:33Z 2017-08-25T05:41:33Z 2017-07-20 Thesis http://hdl.handle.net/10889/10585 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 |
spellingShingle |
Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 Μπίτζας, Δημήτρης Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
description |
Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας. |
author2 |
Δερματάς, Ευάγγελος |
author_facet |
Δερματάς, Ευάγγελος Μπίτζας, Δημήτρης |
format |
Thesis |
author |
Μπίτζας, Δημήτρης |
author_sort |
Μπίτζας, Δημήτρης |
title |
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
title_short |
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
title_full |
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
title_fullStr |
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
title_full_unstemmed |
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
title_sort |
ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας |
publishDate |
2017 |
url |
http://hdl.handle.net/10889/10585 |
work_keys_str_mv |
AT mpitzasdēmētrēs anaptyxēsystēmatosanagnōrisēsomiliassemēchanesparallēlēsepexergasias AT mpitzasdēmētrēs developmentofspeechrecognitionsystemonparallelcomputingmachines |
_version_ |
1771297136682467328 |