Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/24372 |
id |
nemertes-10889-24372 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-243722023-02-03T04:36:50Z Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 Building speech recognition system using the mictrocontroller STM32F334R8 Τσουκαλάς, Παύλος Tsoukalas, Pavlos Ενσωματωμένα συστήματα Αναγνώριση ομιλίας Μικροϋπολογιστές C γλώσσα προγραμματισμού Επεξεργασία σημάτων Κρυφό μοντέλο Markov Embedded systems Speech recognition Microcontrollers C programming language Hidden markov model Signal processing STM32 Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν εφικτό, καθώς δεν υπήρχε ο κατάλληλος εξοπλισμός και η τεχνογνωσία για να υλοποιηθεί. Στις μέρες μας όμως, με την ραγδαία ανάπτυξη της τεχνολογίας όχι απλά είναι εφικτό αλλά, μπορεί να πραγματοποιηθεί με πολύ μικρό κόστος και με ένα χαμηλού επιπέδου σύστημα. Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs). Η υλοποίηση του συστήματος γίνεται με την γλώσσα προγραμματισμού C βασισμένη στo γραφικό περιβάλλον χρήστη Keil uVision, χρησιμοποιώντας τον μικροελεγκτή STM32F334R8. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση ενός συστήματος αναγνώρισης ομιλίας στην οποία θα μπορεί ο τελικός χρήστης να χρησιμοποιεί προκειμένου να αποφύγει τους κοινού μεθόδους εισαγωγής κειμένου και να αξιοποιεί την ανθρώπινη ομιλία για την αναπαράσταση κειμένου. Speech Recognition is an important technological achievement, as it has made our lives easier. Its applications can be found in the field of automobiles, medicine, people with disabilities, and even in the military. In earlier times, such a thing was not possible, as there was no suitable equipment and know-how to implement it. Nowadays, however, with the rapid development of technology, it is not only possible, but it can be carried out at a very low cost and with a low-end system. This thesis focuses on the development of a speech recognition system based on the hidden Markov model (HMM). Mel-frequency cepstral coefficients (MFCCs) are used for speech coding. The implementation of the system is done with the C programming language based on the Keil uVision graphical user interface, using the STM32F334R8 microcontroller. The main goal of the thesis is to implement a speech recognition system in which the end user can use in order to avoid common text input methods and utilize human speech for text representation. 2023-02-02T13:39:22Z 2023-02-02T13:39:22Z 2022-12-10 https://hdl.handle.net/10889/24372 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ενσωματωμένα συστήματα Αναγνώριση ομιλίας Μικροϋπολογιστές C γλώσσα προγραμματισμού Επεξεργασία σημάτων Κρυφό μοντέλο Markov Embedded systems Speech recognition Microcontrollers C programming language Hidden markov model Signal processing STM32 |
spellingShingle |
Ενσωματωμένα συστήματα Αναγνώριση ομιλίας Μικροϋπολογιστές C γλώσσα προγραμματισμού Επεξεργασία σημάτων Κρυφό μοντέλο Markov Embedded systems Speech recognition Microcontrollers C programming language Hidden markov model Signal processing STM32 Τσουκαλάς, Παύλος Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
description |
Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν εφικτό, καθώς δεν υπήρχε ο κατάλληλος εξοπλισμός και η τεχνογνωσία για να υλοποιηθεί. Στις μέρες μας όμως, με την ραγδαία ανάπτυξη της τεχνολογίας όχι απλά είναι εφικτό αλλά, μπορεί να πραγματοποιηθεί με πολύ μικρό κόστος και με ένα χαμηλού επιπέδου σύστημα.
Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs). Η υλοποίηση του συστήματος γίνεται με την γλώσσα προγραμματισμού C βασισμένη στo γραφικό περιβάλλον χρήστη Keil uVision, χρησιμοποιώντας τον μικροελεγκτή STM32F334R8. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση ενός συστήματος αναγνώρισης ομιλίας στην οποία θα μπορεί ο τελικός χρήστης να χρησιμοποιεί προκειμένου να αποφύγει τους κοινού μεθόδους εισαγωγής κειμένου και να αξιοποιεί την ανθρώπινη ομιλία για την αναπαράσταση κειμένου. |
author2 |
Tsoukalas, Pavlos |
author_facet |
Tsoukalas, Pavlos Τσουκαλάς, Παύλος |
author |
Τσουκαλάς, Παύλος |
author_sort |
Τσουκαλάς, Παύλος |
title |
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
title_short |
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
title_full |
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
title_fullStr |
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
title_full_unstemmed |
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 |
title_sort |
κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή stm32f334r8 |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/24372 |
work_keys_str_mv |
AT tsoukalaspaulos kataskeuēsystēmatosanagnōrisēsomiliasmetēchrēsētoumikroelenktēstm32f334r8 AT tsoukalaspaulos buildingspeechrecognitionsystemusingthemictrocontrollerstm32f334r8 |
_version_ |
1771297251973398528 |