Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)

Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση υπολογιστών...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τρίψιας, Παναγιώτης
Άλλοι συγγραφείς: Tripsias, Panagiotis
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25452
id nemertes-10889-25452
record_format dspace
spelling nemertes-10889-254522023-07-11T03:59:08Z Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) Video processing for sign language analysis with emphasis on fingerspelling Τρίψιας, Παναγιώτης Tripsias, Panagiotis Μηχανική μάθηση Συνελικτικά νευρωνικά δίκτυα Σιαμαία συνελικτικά νευρωνικά δίκτυα Ομαδοποίηση εικόνων Machine learning Convolutional neural networks Siamese convolutional neural networks Clustering images Mediapipe Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση υπολογιστών, μεγαλώνει ολοένα και περισσότερο, θα μπορούν και αυτοί να έχουν πρόσβαση στις νέες τεχνολογίες που δημιουργούνται μέσω των συστημάτων αναγνώρισης. Όμως, αξίζει να σημειωθεί πως η εκπαίδευση των συστημάτων αναγνώρισης της νοηματικής γλώσσας είναι μια δύσκολη διαδικασία, καθώς απαιτούνται κατάλληλη προεπεξεργασία των σημάτων εικόνας και βίντεο και πρόσβαση σε συστήματα με μεγάλη υπολογιστική ισχύ και μεγάλο όγκο δεδομένων για επεξεργασία και εκπαίδευση. Στην παρούσα Διπλωματική Εργασία μελετήσαμε και επιλύσαμε την ταξινόμηση με χρήση keyframes για αναγνώριση της Ελληνικής Νοηματικής Γλώσσας. Στο πρώτο κεφάλαιο αναλύεται η σημασία του προβλήματος και το πόσο σημαντικό είναι η ανάπτυξη συστημάτων για αλληλεπίδραση των κωφών ανθρώπων με υπολογιστικά συστήματα. Στο δεύτερο κεφάλαιο γίνεται μια εισαγωγή και μια ανάλυση στις μεθόδους της τελευταίας τεχνολογίας, όπως επίσης και στις τεχνικές που χρησιμοποιούνται για την υλοποίηση της εργασίας. Στη συνέχεια, στο τρίτο κεφάλαιο αναλύεται όλη η μεθοδολογία που ακολουθήθηκε για την υλοποίηση της εργασίας, όλα τα στάδια που πραγματοποιήθηκαν και οι αρχιτεκτονικές που χρησιμοποιήθηκαν. Στο επόμενο κεφάλαιο παρουσιάζονται τα αποτελέσματα που προέκυψαν από τη διαδικασία και στο τελευταίο συνοψίζονται τα συμπεράσματα και ταυτόχρονα γίνεται αναφορά για μελλοντικά σχέδια και προοπτικές που ανοίγουν για το μέλλον. In today's world, human lifestyle is drastically influenced by the development of technology, which serves basic principles of sign language recognition. As the need for communication between people with speech and hearing impairments using computers grows more and more, they too will be able to access the new technologies created through recognition systems. However, it is worth noting that the training of sign language recognition systems is a difficult process, as it requires appropriate pre-processing of image and video signals and access to systems with high computing power and large amounts of data for processing and training. In this Diploma Thesis we studied and solved the classification using keyframes for Greek Sign Language recognition. In the first chapter we discuss the importance of the problem and the importance of developing systems for deaf people to interact with computer systems. The second chapter provides an introduction and an analysis of the state-of-the-art methods, as well as the techniques used to implement the work. Then, the third chapter discusses all the methodology followed to implement the work, all the steps taken and the architectures used. The next chapter presents the results obtained from the process and the last one summarizes the conclusions and, at the same time, reports on future plans and perspectives for the future. 2023-07-10T05:00:37Z 2023-07-10T05:00:37Z 2023-07-08 https://hdl.handle.net/10889/25452 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μηχανική μάθηση
Συνελικτικά νευρωνικά δίκτυα
Σιαμαία συνελικτικά νευρωνικά δίκτυα
Ομαδοποίηση εικόνων
Machine learning
Convolutional neural networks
Siamese convolutional neural networks
Clustering images
Mediapipe
spellingShingle Μηχανική μάθηση
Συνελικτικά νευρωνικά δίκτυα
Σιαμαία συνελικτικά νευρωνικά δίκτυα
Ομαδοποίηση εικόνων
Machine learning
Convolutional neural networks
Siamese convolutional neural networks
Clustering images
Mediapipe
Τρίψιας, Παναγιώτης
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
description Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση υπολογιστών, μεγαλώνει ολοένα και περισσότερο, θα μπορούν και αυτοί να έχουν πρόσβαση στις νέες τεχνολογίες που δημιουργούνται μέσω των συστημάτων αναγνώρισης. Όμως, αξίζει να σημειωθεί πως η εκπαίδευση των συστημάτων αναγνώρισης της νοηματικής γλώσσας είναι μια δύσκολη διαδικασία, καθώς απαιτούνται κατάλληλη προεπεξεργασία των σημάτων εικόνας και βίντεο και πρόσβαση σε συστήματα με μεγάλη υπολογιστική ισχύ και μεγάλο όγκο δεδομένων για επεξεργασία και εκπαίδευση. Στην παρούσα Διπλωματική Εργασία μελετήσαμε και επιλύσαμε την ταξινόμηση με χρήση keyframes για αναγνώριση της Ελληνικής Νοηματικής Γλώσσας. Στο πρώτο κεφάλαιο αναλύεται η σημασία του προβλήματος και το πόσο σημαντικό είναι η ανάπτυξη συστημάτων για αλληλεπίδραση των κωφών ανθρώπων με υπολογιστικά συστήματα. Στο δεύτερο κεφάλαιο γίνεται μια εισαγωγή και μια ανάλυση στις μεθόδους της τελευταίας τεχνολογίας, όπως επίσης και στις τεχνικές που χρησιμοποιούνται για την υλοποίηση της εργασίας. Στη συνέχεια, στο τρίτο κεφάλαιο αναλύεται όλη η μεθοδολογία που ακολουθήθηκε για την υλοποίηση της εργασίας, όλα τα στάδια που πραγματοποιήθηκαν και οι αρχιτεκτονικές που χρησιμοποιήθηκαν. Στο επόμενο κεφάλαιο παρουσιάζονται τα αποτελέσματα που προέκυψαν από τη διαδικασία και στο τελευταίο συνοψίζονται τα συμπεράσματα και ταυτόχρονα γίνεται αναφορά για μελλοντικά σχέδια και προοπτικές που ανοίγουν για το μέλλον.
author2 Tripsias, Panagiotis
author_facet Tripsias, Panagiotis
Τρίψιας, Παναγιώτης
author Τρίψιας, Παναγιώτης
author_sort Τρίψιας, Παναγιώτης
title Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
title_short Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
title_full Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
title_fullStr Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
title_full_unstemmed Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
title_sort επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
publishDate 2023
url https://hdl.handle.net/10889/25452
work_keys_str_mv AT tripsiaspanagiōtēs epexergasiabinteogiaanalysēnoēmatikēsglōssasmeemphasēstonsyllabismofingerspelling
AT tripsiaspanagiōtēs videoprocessingforsignlanguageanalysiswithemphasisonfingerspelling
_version_ 1771297308030271488