Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας

Η παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Μπόρας, Ιωσήφ
Άλλοι συγγραφείς:	Φακωτάκης, Νίκος
Μορφή:	Thesis
Γλώσσα:	Greek
Έκδοση:	2009
Θέματα:	Τεμαχισμός ομιλίας Κρυμμένα μοντέλα Μαρκώφ Αναγνώριση ομιλίας Σύνθεση ομιλίας Αναγνώριση γλώσσας Αλγόριθμος Βιτέρμπι Μαθηματική παλινδρόμηση Δυναμική παραμόρφωση χρόνου Speech segmentation Hidden Markov models Speech recognition Speech synthesis Language recognition Viterbi algorithm Regression Dynamic time warping 006.454
Διαθέσιμο Online:	http://nemertes.lis.upatras.gr/jspui/handle/10889/2068

id	nemertes-10889-2068
record_format	dspace
spelling	nemertes-10889-20682022-09-05T05:00:40Z Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας Automatic segmentation of digital speech signals and application to speech synthesis, speech recognition and language recognition Μπόρας, Ιωσήφ Φακωτάκης, Νίκος Φακωτάκης, Νίκος Μουρτζόπουλος, Ιωάννης Δερματάς, Ευάγγελος Αναστασόπουλος, Βασίλειος Γαλατσάνος, Νικόλαος Μπερμπερίδης, Κωνσταντίνος Παλιουράς, Βασίλειος Mporas, Iosif Τεμαχισμός ομιλίας Κρυμμένα μοντέλα Μαρκώφ Αναγνώριση ομιλίας Σύνθεση ομιλίας Αναγνώριση γλώσσας Αλγόριθμος Βιτέρμπι Μαθηματική παλινδρόμηση Δυναμική παραμόρφωση χρόνου Speech segmentation Hidden Markov models Speech recognition Speech synthesis Language recognition Viterbi algorithm Regression Dynamic time warping 006.454 Η παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν στα ανοίγματα των φωνητικών χορδών κατά την διάρκεια της ομιλίας για να εξάγει όρια ψευδό-φωνημάτων με χρήση του αλγορίθμου δυναμικής παραμόρφωσης χρόνου. Η δεύτερη τεχνική εισάγει μια καινοτόμα υβριδική μέθοδο εκπαίδευσης κρυμμένων μοντέλων Μαρκώφ, η οποία τα καθιστά πιο αποτελεσματικά στον τεμαχισμό της ομιλίας. Η τρίτη μέθοδος χρησιμοποιεί αλγορίθμους μαθηματικής παλινδρόμησης για τον συνδυασμό ανεξαρτήτων μηχανών τεμαχισμού ομιλίας. Η τέταρτη μέθοδος εισάγει μια επέκταση του αλγορίθμου Βιτέρμπι με χρήση πολλαπλών παραμετρικών τεχνικών για τον τεμαχισμό της ομιλίας. Τέλος, οι προτεινόμενες μέθοδοι τεμαχισμού χρησιμοποιούνται για την βελτίωση συστημάτων στο πρόβλημα της σύνθεσης ομιλίας, αναγνώρισης ομιλίας και αναγνώρισης γλώσσας. The present dissertation introduces methods for the automatic segmentation of speech signals. In detail, four new segmentation methods are presented both in for the cases of linguistically constrained or not segmentation. The first method uses pitchmark points to extract pseudo-phonetic boundaries using dynamic time warping algorithm. The second technique introduces a new hybrid method for the training of hidden Markov models, which makes them more effective in the speech segmentation task. The third method uses regression algorithms for the fusion of independent segmentation engines. The fourth method is an extension of the Viterbi algorithm using multiple speech parameterization techniques for segmentation. Finally, the proposed methods are used to improve systems in the task of speech synthesis, speech recognition and language recognition. 2009-10-19T12:25:00Z 2009-10-19T12:25:00Z 2009-07-02 2009-10-19T12:25:00Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/2068 gr Η ΒΥΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. 0 application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Τεμαχισμός ομιλίας Κρυμμένα μοντέλα Μαρκώφ Αναγνώριση ομιλίας Σύνθεση ομιλίας Αναγνώριση γλώσσας Αλγόριθμος Βιτέρμπι Μαθηματική παλινδρόμηση Δυναμική παραμόρφωση χρόνου Speech segmentation Hidden Markov models Speech recognition Speech synthesis Language recognition Viterbi algorithm Regression Dynamic time warping 006.454
spellingShingle	Τεμαχισμός ομιλίας Κρυμμένα μοντέλα Μαρκώφ Αναγνώριση ομιλίας Σύνθεση ομιλίας Αναγνώριση γλώσσας Αλγόριθμος Βιτέρμπι Μαθηματική παλινδρόμηση Δυναμική παραμόρφωση χρόνου Speech segmentation Hidden Markov models Speech recognition Speech synthesis Language recognition Viterbi algorithm Regression Dynamic time warping 006.454 Μπόρας, Ιωσήφ Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
description	Η παρούσα διατριβή εισάγει μεθόδους για τον αυτόματο τεμαχισμό σημάτων ομιλίας. Συγκεκριμένα παρουσιάζονται τέσσερις νέες μέθοδοι για τον αυτόματο τεμαχισμό σημάτων ομιλίας, τόσο για γλωσσολογικά περιορισμένα όσο και μη προβλήματα. Η πρώτη μέθοδος κάνει χρήση των σημείων του σήματος που αντιστοιχούν στα ανοίγματα των φωνητικών χορδών κατά την διάρκεια της ομιλίας για να εξάγει όρια ψευδό-φωνημάτων με χρήση του αλγορίθμου δυναμικής παραμόρφωσης χρόνου. Η δεύτερη τεχνική εισάγει μια καινοτόμα υβριδική μέθοδο εκπαίδευσης κρυμμένων μοντέλων Μαρκώφ, η οποία τα καθιστά πιο αποτελεσματικά στον τεμαχισμό της ομιλίας. Η τρίτη μέθοδος χρησιμοποιεί αλγορίθμους μαθηματικής παλινδρόμησης για τον συνδυασμό ανεξαρτήτων μηχανών τεμαχισμού ομιλίας. Η τέταρτη μέθοδος εισάγει μια επέκταση του αλγορίθμου Βιτέρμπι με χρήση πολλαπλών παραμετρικών τεχνικών για τον τεμαχισμό της ομιλίας. Τέλος, οι προτεινόμενες μέθοδοι τεμαχισμού χρησιμοποιούνται για την βελτίωση συστημάτων στο πρόβλημα της σύνθεσης ομιλίας, αναγνώρισης ομιλίας και αναγνώρισης γλώσσας.
author2	Φακωτάκης, Νίκος
author_facet	Φακωτάκης, Νίκος Μπόρας, Ιωσήφ
format	Thesis
author	Μπόρας, Ιωσήφ
author_sort	Μπόρας, Ιωσήφ
title	Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
title_short	Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
title_full	Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
title_fullStr	Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
title_full_unstemmed	Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
title_sort	αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας
publishDate	2009
url	http://nemertes.lis.upatras.gr/jspui/handle/10889/2068
work_keys_str_mv	AT mporasiōsēph automatostemachismospsēphiakōnsēmatōnomiliaskaiepharmogēstēsynthesēomiliasanagnōrisēomiliaskaianagnōrisēglōssas AT mporasiōsēph automaticsegmentationofdigitalspeechsignalsandapplicationtospeechsynthesisspeechrecognitionandlanguagerecognition
_version_	1771297128273936384

Αυτόματος τεμαχισμός ψηφιακών σημάτων ομιλίας και εφαρμογή στη σύνθεση ομιλίας, αναγνώριση ομιλίας και αναγνώριση γλώσσας

Παρόμοια τεκμήρια