Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας

Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Μπίτζας, Δημήτρης
Άλλοι συγγραφείς:	Δερματάς, Ευάγγελος
Μορφή:	Thesis
Γλώσσα:	Greek
Έκδοση:	2017
Θέματα:	Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454
Διαθέσιμο Online:	http://hdl.handle.net/10889/10585

id	nemertes-10889-10585
record_format	dspace
spelling	nemertes-10889-105852022-09-05T05:00:32Z Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας Development of speech recognition system on parallel computing machines Μπίτζας, Δημήτρης Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Bitzas, Dimitris Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας. The objective of this thesis is the development of an Automated Speech Recognition (ASR) system based on the combination of Hidden Markov Model (HMM) and Gaussian Mixture Model (GMM). Mel-frequency Cepstral Coefficients (MFCCs) were used to encode the parameters of speech. Both Central Process Unit (CPU) serialized execution and Graphics Process Unit (GPU) parallel execution, were implemented. The system was developed with the programming language C++ and its Graphical User Interface (GUI) was created with the IDE QT. Parallel programming implemented with the use of OpenCL framework. Finally, comparisons of serial and parallel executions are presented in the results section in order to evaluate the use of parallel programming in Speech Recognition applications. 2017-08-25T05:41:33Z 2017-08-25T05:41:33Z 2017-07-20 Thesis http://hdl.handle.net/10889/10585 gr 0 application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454
spellingShingle	Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 Μπίτζας, Δημήτρης Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
description	Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας.
author2	Δερματάς, Ευάγγελος
author_facet	Δερματάς, Ευάγγελος Μπίτζας, Δημήτρης
format	Thesis
author	Μπίτζας, Δημήτρης
author_sort	Μπίτζας, Δημήτρης
title	Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_short	Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_full	Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_fullStr	Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_full_unstemmed	Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_sort	ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
publishDate	2017
url	http://hdl.handle.net/10889/10585
work_keys_str_mv	AT mpitzasdēmētrēs anaptyxēsystēmatosanagnōrisēsomiliassemēchanesparallēlēsepexergasias AT mpitzasdēmētrēs developmentofspeechrecognitionsystemonparallelcomputingmachines
_version_	1771297136682467328

Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας

Παρόμοια τεκμήρια