Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας

Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μπίτζας, Δημήτρης
Άλλοι συγγραφείς: Δερματάς, Ευάγγελος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10585
id nemertes-10889-10585
record_format dspace
spelling nemertes-10889-105852022-09-05T05:00:32Z Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας Development of speech recognition system on parallel computing machines Μπίτζας, Δημήτρης Δερματάς, Ευάγγελος Φακωτάκης, Νικόλαος Bitzas, Dimitris Αναγνώριση ομιλίας Παράλληλη επεξεργασία Speech recognition Parallel computing 006.454 Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας. The objective of this thesis is the development of an Automated Speech Recognition (ASR) system based on the combination of Hidden Markov Model (HMM) and Gaussian Mixture Model (GMM). Mel-frequency Cepstral Coefficients (MFCCs) were used to encode the parameters of speech. Both Central Process Unit (CPU) serialized execution and Graphics Process Unit (GPU) parallel execution, were implemented. The system was developed with the programming language C++ and its Graphical User Interface (GUI) was created with the IDE QT. Parallel programming implemented with the use of OpenCL framework. Finally, comparisons of serial and parallel executions are presented in the results section in order to evaluate the use of parallel programming in Speech Recognition applications. 2017-08-25T05:41:33Z 2017-08-25T05:41:33Z 2017-07-20 Thesis http://hdl.handle.net/10889/10585 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Αναγνώριση ομιλίας
Παράλληλη επεξεργασία
Speech recognition
Parallel computing
006.454
spellingShingle Αναγνώριση ομιλίας
Παράλληλη επεξεργασία
Speech recognition
Parallel computing
006.454
Μπίτζας, Δημήτρης
Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
description Η διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ) συνδυασμένο με μοντέλο μίγματος κανονικών κατανομών(GMM). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs) . Η υλοποίηση του συστήματος γίνεται με την ανάπτυξη προγράμματος σε γλώσσα C++ με γραφική διεπαφή χρήστη δημιουργημένη με το εργαλείο QT. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση του συστήματος για εκτέλεση στην κεντρική μονάδα επεξεργασίας (CPU), αλλά και στην μονάδα επεξεργασίας της κάρτας γραφικών (GPU) με τεχνικές παράλληλης επεξεργασίας. Ο προγραμματισμός της κάρτας γραφικών έγινε με την χρήση της OpenCL, μιας δομής που κατά κύριο λόγο υποστηρίζει την εκτέλεση εντολών σε μηχανές παράλληλης επεξεργασίας. Στο τέλος γίνεται σύγκριση της απόδοσης των δύο υλοποιήσεων και εξάγονται κάποια συμπεράσματα για την αξία της χρήσης παράλληλης επεξεργασίας στην αναγνώριση ομιλίας.
author2 Δερματάς, Ευάγγελος
author_facet Δερματάς, Ευάγγελος
Μπίτζας, Δημήτρης
format Thesis
author Μπίτζας, Δημήτρης
author_sort Μπίτζας, Δημήτρης
title Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_short Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_full Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_fullStr Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_full_unstemmed Ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
title_sort ανάπτυξη συστήματος αναγνώρισης ομιλίας σε μηχανές παράλληλης επεξεργασίας
publishDate 2017
url http://hdl.handle.net/10889/10585
work_keys_str_mv AT mpitzasdēmētrēs anaptyxēsystēmatosanagnōrisēsomiliassemēchanesparallēlēsepexergasias
AT mpitzasdēmētrēs developmentofspeechrecognitionsystemonparallelcomputingmachines
_version_ 1771297136682467328