Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8

Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τσουκαλάς, Παύλος
Άλλοι συγγραφείς: Tsoukalas, Pavlos
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/24372
id nemertes-10889-24372
record_format dspace
spelling nemertes-10889-243722023-02-03T04:36:50Z Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8 Building speech recognition system using the mictrocontroller STM32F334R8 Τσουκαλάς, Παύλος Tsoukalas, Pavlos Ενσωματωμένα συστήματα Αναγνώριση ομιλίας Μικροϋπολογιστές C γλώσσα προγραμματισμού Επεξεργασία σημάτων Κρυφό μοντέλο Markov Embedded systems Speech recognition Microcontrollers C programming language Hidden markov model Signal processing STM32 Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν εφικτό, καθώς δεν υπήρχε ο κατάλληλος εξοπλισμός και η τεχνογνωσία για να υλοποιηθεί. Στις μέρες μας όμως, με την ραγδαία ανάπτυξη της τεχνολογίας όχι απλά είναι εφικτό αλλά, μπορεί να πραγματοποιηθεί με πολύ μικρό κόστος και με ένα χαμηλού επιπέδου σύστημα. Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs). Η υλοποίηση του συστήματος γίνεται με την γλώσσα προγραμματισμού C βασισμένη στo γραφικό περιβάλλον χρήστη Keil uVision, χρησιμοποιώντας τον μικροελεγκτή STM32F334R8. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση ενός συστήματος αναγνώρισης ομιλίας στην οποία θα μπορεί ο τελικός χρήστης να χρησιμοποιεί προκειμένου να αποφύγει τους κοινού μεθόδους εισαγωγής κειμένου και να αξιοποιεί την ανθρώπινη ομιλία για την αναπαράσταση κειμένου. Speech Recognition is an important technological achievement, as it has made our lives easier. Its applications can be found in the field of automobiles, medicine, people with disabilities, and even in the military. In earlier times, such a thing was not possible, as there was no suitable equipment and know-how to implement it. Nowadays, however, with the rapid development of technology, it is not only possible, but it can be carried out at a very low cost and with a low-end system. This thesis focuses on the development of a speech recognition system based on the hidden Markov model (HMM). Mel-frequency cepstral coefficients (MFCCs) are used for speech coding. The implementation of the system is done with the C programming language based on the Keil uVision graphical user interface, using the STM32F334R8 microcontroller. The main goal of the thesis is to implement a speech recognition system in which the end user can use in order to avoid common text input methods and utilize human speech for text representation. 2023-02-02T13:39:22Z 2023-02-02T13:39:22Z 2022-12-10 https://hdl.handle.net/10889/24372 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ενσωματωμένα συστήματα
Αναγνώριση ομιλίας
Μικροϋπολογιστές
C γλώσσα προγραμματισμού
Επεξεργασία σημάτων
Κρυφό μοντέλο Markov
Embedded systems
Speech recognition
Microcontrollers
C programming language
Hidden markov model
Signal processing
STM32
spellingShingle Ενσωματωμένα συστήματα
Αναγνώριση ομιλίας
Μικροϋπολογιστές
C γλώσσα προγραμματισμού
Επεξεργασία σημάτων
Κρυφό μοντέλο Markov
Embedded systems
Speech recognition
Microcontrollers
C programming language
Hidden markov model
Signal processing
STM32
Τσουκαλάς, Παύλος
Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
description Η Αναγνώριση Ομιλίας αποτελεί ένα σημαντικό τεχνολογικό επίτευγμα, καθώς χάριν σε αυτό έχει γίνει η ζωή μας πιο εύκολη. Τις εφαρμογές της μπορεί να τις βρει κανείς στο τομέα της αυτοκίνησης, της ιατρικής, σε άτομα με ειδικές ανάγκες, ακόμα και στον στρατό. Σε παλαιότερες εποχές κάτι τέτοιο δεν ήταν εφικτό, καθώς δεν υπήρχε ο κατάλληλος εξοπλισμός και η τεχνογνωσία για να υλοποιηθεί. Στις μέρες μας όμως, με την ραγδαία ανάπτυξη της τεχνολογίας όχι απλά είναι εφικτό αλλά, μπορεί να πραγματοποιηθεί με πολύ μικρό κόστος και με ένα χαμηλού επιπέδου σύστημα. Η παρούσα διπλωματική εργασία επικεντρώνεται στην ανάπτυξη ενός συστήματος αναγνώρισης ομιλίας βασισμένο στο κρυμμένο μοντέλο Markov (ΗΜΜ). Για την κωδικοποίηση της ομιλίας χρησιμοποιούνται οι Mel-frequency cepstral coefficients (MFCCs). Η υλοποίηση του συστήματος γίνεται με την γλώσσα προγραμματισμού C βασισμένη στo γραφικό περιβάλλον χρήστη Keil uVision, χρησιμοποιώντας τον μικροελεγκτή STM32F334R8. Ο βασικός στόχος της διπλωματικής είναι η υλοποίηση ενός συστήματος αναγνώρισης ομιλίας στην οποία θα μπορεί ο τελικός χρήστης να χρησιμοποιεί προκειμένου να αποφύγει τους κοινού μεθόδους εισαγωγής κειμένου και να αξιοποιεί την ανθρώπινη ομιλία για την αναπαράσταση κειμένου.
author2 Tsoukalas, Pavlos
author_facet Tsoukalas, Pavlos
Τσουκαλάς, Παύλος
author Τσουκαλάς, Παύλος
author_sort Τσουκαλάς, Παύλος
title Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
title_short Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
title_full Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
title_fullStr Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
title_full_unstemmed Κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή STM32F334R8
title_sort κατασκευή συστήματος αναγνώρισης ομιλίας με τη χρήση του μικροελεγκτή stm32f334r8
publishDate 2023
url https://hdl.handle.net/10889/24372
work_keys_str_mv AT tsoukalaspaulos kataskeuēsystēmatosanagnōrisēsomiliasmetēchrēsētoumikroelenktēstm32f334r8
AT tsoukalaspaulos buildingspeechrecognitionsystemusingthemictrocontrollerstm32f334r8
_version_ 1771297251973398528