Οπτική αποκωδικοποίηση ομιλίας

Η οπτική αποκωδικοποίηση ομιλίας έχει ασκηθεί εδώ και αιώνες από τους επιστήμονες με σκοπό την αποτελεσματική επικοινωνία μεταξύ ανθρώπων. Σε αυτή τη μελέτη, διερευνάται η χρήση τεχνικών μηχανικής εκμάθησης στην ανάγνωση των χειλιών. Αρχικά, έχοντας μία έτοιμη βάση δεδομένων με τα χαρακτηριστικά σημ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μαμασούλα, Ουρανία-Μαρία
Άλλοι συγγραφείς: Οικονόμου, Γεώργιος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2019
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/12548
Περιγραφή
Περίληψη:Η οπτική αποκωδικοποίηση ομιλίας έχει ασκηθεί εδώ και αιώνες από τους επιστήμονες με σκοπό την αποτελεσματική επικοινωνία μεταξύ ανθρώπων. Σε αυτή τη μελέτη, διερευνάται η χρήση τεχνικών μηχανικής εκμάθησης στην ανάγνωση των χειλιών. Αρχικά, έχοντας μία έτοιμη βάση δεδομένων με τα χαρακτηριστικά σημεία ενός προσώπου που μιλάει, τα οποία έχουν επιλεγεί από βίντεο, εξάγονται τα σημαντικά σημεία για την αποκωδικοποίηση της ομιλίας, δηλαδή του στόματος. Τα σημεία αυτά αντιμετωπίζονται ως διανύσματα στον δισδιάστατο χώρο, κανονικοποιούνται και χωρίζονται σε δεδομένα εκπαίδευσης και δεδομένα test. Τέλος χρησιμοποιείται ένα σύστημα ταξινόμησης και γίνεται αξιολόγηση της απόδοσης του για διάφορες συνθήκες ταξινόμησης. Ακόμη, μελετώνται επιγραμματικά διάφορες πιο σύγχρονες τεχνικές Οπτικής αποκωδικοποίησης ομιλίας που βασίζονται σε νευρωνικά και συνελικτικά δίκτυα.