Οπτική αποκωδικοποίηση ομιλίας

Η οπτική αποκωδικοποίηση ομιλίας έχει ασκηθεί εδώ και αιώνες από τους επιστήμονες με σκοπό την αποτελεσματική επικοινωνία μεταξύ ανθρώπων. Σε αυτή τη μελέτη, διερευνάται η χρήση τεχνικών μηχανικής εκμάθησης στην ανάγνωση των χειλιών. Αρχικά, έχοντας μία έτοιμη βάση δεδομένων με τα χαρακτηριστικά σημ...

Full description

Bibliographic Details
Main Author: Μαμασούλα, Ουρανία-Μαρία
Other Authors: Οικονόμου, Γεώργιος
Format: Thesis
Language:Greek
Published: 2019
Subjects:
Online Access:http://hdl.handle.net/10889/12548
Description
Summary:Η οπτική αποκωδικοποίηση ομιλίας έχει ασκηθεί εδώ και αιώνες από τους επιστήμονες με σκοπό την αποτελεσματική επικοινωνία μεταξύ ανθρώπων. Σε αυτή τη μελέτη, διερευνάται η χρήση τεχνικών μηχανικής εκμάθησης στην ανάγνωση των χειλιών. Αρχικά, έχοντας μία έτοιμη βάση δεδομένων με τα χαρακτηριστικά σημεία ενός προσώπου που μιλάει, τα οποία έχουν επιλεγεί από βίντεο, εξάγονται τα σημαντικά σημεία για την αποκωδικοποίηση της ομιλίας, δηλαδή του στόματος. Τα σημεία αυτά αντιμετωπίζονται ως διανύσματα στον δισδιάστατο χώρο, κανονικοποιούνται και χωρίζονται σε δεδομένα εκπαίδευσης και δεδομένα test. Τέλος χρησιμοποιείται ένα σύστημα ταξινόμησης και γίνεται αξιολόγηση της απόδοσης του για διάφορες συνθήκες ταξινόμησης. Ακόμη, μελετώνται επιγραμματικά διάφορες πιο σύγχρονες τεχνικές Οπτικής αποκωδικοποίησης ομιλίας που βασίζονται σε νευρωνικά και συνελικτικά δίκτυα.