Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling)
Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση υπολογιστών...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/25452 |
id |
nemertes-10889-25452 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-254522023-07-11T03:59:08Z Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) Video processing for sign language analysis with emphasis on fingerspelling Τρίψιας, Παναγιώτης Tripsias, Panagiotis Μηχανική μάθηση Συνελικτικά νευρωνικά δίκτυα Σιαμαία συνελικτικά νευρωνικά δίκτυα Ομαδοποίηση εικόνων Machine learning Convolutional neural networks Siamese convolutional neural networks Clustering images Mediapipe Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση υπολογιστών, μεγαλώνει ολοένα και περισσότερο, θα μπορούν και αυτοί να έχουν πρόσβαση στις νέες τεχνολογίες που δημιουργούνται μέσω των συστημάτων αναγνώρισης. Όμως, αξίζει να σημειωθεί πως η εκπαίδευση των συστημάτων αναγνώρισης της νοηματικής γλώσσας είναι μια δύσκολη διαδικασία, καθώς απαιτούνται κατάλληλη προεπεξεργασία των σημάτων εικόνας και βίντεο και πρόσβαση σε συστήματα με μεγάλη υπολογιστική ισχύ και μεγάλο όγκο δεδομένων για επεξεργασία και εκπαίδευση. Στην παρούσα Διπλωματική Εργασία μελετήσαμε και επιλύσαμε την ταξινόμηση με χρήση keyframes για αναγνώριση της Ελληνικής Νοηματικής Γλώσσας. Στο πρώτο κεφάλαιο αναλύεται η σημασία του προβλήματος και το πόσο σημαντικό είναι η ανάπτυξη συστημάτων για αλληλεπίδραση των κωφών ανθρώπων με υπολογιστικά συστήματα. Στο δεύτερο κεφάλαιο γίνεται μια εισαγωγή και μια ανάλυση στις μεθόδους της τελευταίας τεχνολογίας, όπως επίσης και στις τεχνικές που χρησιμοποιούνται για την υλοποίηση της εργασίας. Στη συνέχεια, στο τρίτο κεφάλαιο αναλύεται όλη η μεθοδολογία που ακολουθήθηκε για την υλοποίηση της εργασίας, όλα τα στάδια που πραγματοποιήθηκαν και οι αρχιτεκτονικές που χρησιμοποιήθηκαν. Στο επόμενο κεφάλαιο παρουσιάζονται τα αποτελέσματα που προέκυψαν από τη διαδικασία και στο τελευταίο συνοψίζονται τα συμπεράσματα και ταυτόχρονα γίνεται αναφορά για μελλοντικά σχέδια και προοπτικές που ανοίγουν για το μέλλον. In today's world, human lifestyle is drastically influenced by the development of technology, which serves basic principles of sign language recognition. As the need for communication between people with speech and hearing impairments using computers grows more and more, they too will be able to access the new technologies created through recognition systems. However, it is worth noting that the training of sign language recognition systems is a difficult process, as it requires appropriate pre-processing of image and video signals and access to systems with high computing power and large amounts of data for processing and training. In this Diploma Thesis we studied and solved the classification using keyframes for Greek Sign Language recognition. In the first chapter we discuss the importance of the problem and the importance of developing systems for deaf people to interact with computer systems. The second chapter provides an introduction and an analysis of the state-of-the-art methods, as well as the techniques used to implement the work. Then, the third chapter discusses all the methodology followed to implement the work, all the steps taken and the architectures used. The next chapter presents the results obtained from the process and the last one summarizes the conclusions and, at the same time, reports on future plans and perspectives for the future. 2023-07-10T05:00:37Z 2023-07-10T05:00:37Z 2023-07-08 https://hdl.handle.net/10889/25452 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Συνελικτικά νευρωνικά δίκτυα Σιαμαία συνελικτικά νευρωνικά δίκτυα Ομαδοποίηση εικόνων Machine learning Convolutional neural networks Siamese convolutional neural networks Clustering images Mediapipe |
spellingShingle |
Μηχανική μάθηση Συνελικτικά νευρωνικά δίκτυα Σιαμαία συνελικτικά νευρωνικά δίκτυα Ομαδοποίηση εικόνων Machine learning Convolutional neural networks Siamese convolutional neural networks Clustering images Mediapipe Τρίψιας, Παναγιώτης Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
description |
Στην σημερινή εποχή, ο τρόπος ζωής του ανθρώπου επηρεάζεται δραστικά από
την εξέλιξη της τεχνολογίας, η οποία εξυπηρετεί βασικές αρχές της αναγνώρισης
της νοηματικής γλώσσας. Καθώς η ανάγκη για επικοινωνία μεταξύ των
ανθρώπων με όσους παρουσιάζουν προβλήματα ομιλίας και ακοής με τη χρήση
υπολογιστών, μεγαλώνει ολοένα και περισσότερο, θα μπορούν και αυτοί να έχουν
πρόσβαση στις νέες τεχνολογίες που δημιουργούνται μέσω των συστημάτων
αναγνώρισης. Όμως, αξίζει να σημειωθεί πως η εκπαίδευση των συστημάτων
αναγνώρισης της νοηματικής γλώσσας είναι μια δύσκολη διαδικασία, καθώς
απαιτούνται κατάλληλη προεπεξεργασία των σημάτων εικόνας και βίντεο και
πρόσβαση σε συστήματα με μεγάλη υπολογιστική ισχύ και μεγάλο όγκο
δεδομένων για επεξεργασία και εκπαίδευση. Στην παρούσα Διπλωματική
Εργασία μελετήσαμε και επιλύσαμε την ταξινόμηση με χρήση keyframes για
αναγνώριση της Ελληνικής Νοηματικής Γλώσσας. Στο πρώτο κεφάλαιο
αναλύεται η σημασία του προβλήματος και το πόσο σημαντικό είναι η ανάπτυξη
συστημάτων για αλληλεπίδραση των κωφών ανθρώπων με υπολογιστικά
συστήματα. Στο δεύτερο κεφάλαιο γίνεται μια εισαγωγή και μια ανάλυση στις
μεθόδους της τελευταίας τεχνολογίας, όπως επίσης και στις τεχνικές που
χρησιμοποιούνται για την υλοποίηση της εργασίας. Στη συνέχεια, στο τρίτο
κεφάλαιο αναλύεται όλη η μεθοδολογία που ακολουθήθηκε για την υλοποίηση
της εργασίας, όλα τα στάδια που πραγματοποιήθηκαν και οι αρχιτεκτονικές που
χρησιμοποιήθηκαν. Στο επόμενο κεφάλαιο παρουσιάζονται τα αποτελέσματα που
προέκυψαν από τη διαδικασία και στο τελευταίο συνοψίζονται τα συμπεράσματα
και ταυτόχρονα γίνεται αναφορά για μελλοντικά σχέδια και προοπτικές που
ανοίγουν για το μέλλον. |
author2 |
Tripsias, Panagiotis |
author_facet |
Tripsias, Panagiotis Τρίψιας, Παναγιώτης |
author |
Τρίψιας, Παναγιώτης |
author_sort |
Τρίψιας, Παναγιώτης |
title |
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
title_short |
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
title_full |
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
title_fullStr |
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
title_full_unstemmed |
Επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
title_sort |
επεξεργασία βίντεο για ανάλυση νοηματικής γλώσσας με έμφαση στον συλλαβισμό (fingerspelling) |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/25452 |
work_keys_str_mv |
AT tripsiaspanagiōtēs epexergasiabinteogiaanalysēnoēmatikēsglōssasmeemphasēstonsyllabismofingerspelling AT tripsiaspanagiōtēs videoprocessingforsignlanguageanalysiswithemphasisonfingerspelling |
_version_ |
1771297308030271488 |