| Περίληψη: | Η οπτική αποκωδικοποίηση ομιλίας έχει ασκηθεί εδώ και αιώνες από τους επιστήμονες με σκοπό την αποτελεσματική επικοινωνία μεταξύ ανθρώπων. Σε αυτή τη μελέτη, διερευνάται η χρήση τεχνικών μηχανικής εκμάθησης στην ανάγνωση των χειλιών. Αρχικά, έχοντας μία έτοιμη βάση δεδομένων με τα χαρακτηριστικά σημεία ενός προσώπου που μιλάει, τα οποία έχουν επιλεγεί από βίντεο, εξάγονται τα σημαντικά σημεία για την αποκωδικοποίηση της ομιλίας, δηλαδή του στόματος. Τα σημεία αυτά αντιμετωπίζονται ως διανύσματα στον δισδιάστατο χώρο, κανονικοποιούνται και χωρίζονται σε δεδομένα εκπαίδευσης και δεδομένα test. Τέλος χρησιμοποιείται ένα σύστημα ταξινόμησης και γίνεται αξιολόγηση της απόδοσης του για διάφορες συνθήκες ταξινόμησης. Ακόμη, μελετώνται επιγραμματικά διάφορες πιο σύγχρονες τεχνικές Οπτικής αποκωδικοποίησης ομιλίας που βασίζονται σε νευρωνικά και συνελικτικά δίκτυα.
|