Τεχνικές επεξεργασίας φυσικής γλώσσας, εξαγωγής γνώσης και αυτόματης δημιουργίας προσαρμοσμένης στον χρήστη ανάδρασης για ευφυή συστήματα διδασκαλίας

Η παρούσα διδακτορική διατριβή αποσκοπεί στο σχεδιασμό, στην ανάπτυξη και στην αξιοποίηση μηχανισμών και καινοτόμων μεθοδολογιών από τις περιοχές της επεξεργασίας φυσικής γλώσσας, της μηχανικής μάθησης για την αλληλεπίδραση μεταξύ ανθρώπου και υπολογιστικών συστημάτων. Κύρια αντικείμενα του προβλήμα...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Περίκος, Ισίδωρος
Άλλοι συγγραφείς: Χατζηλυγερούδης, Ιωάννης
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10115
Περιγραφή
Περίληψη:Η παρούσα διδακτορική διατριβή αποσκοπεί στο σχεδιασμό, στην ανάπτυξη και στην αξιοποίηση μηχανισμών και καινοτόμων μεθοδολογιών από τις περιοχές της επεξεργασίας φυσικής γλώσσας, της μηχανικής μάθησης για την αλληλεπίδραση μεταξύ ανθρώπου και υπολογιστικών συστημάτων. Κύρια αντικείμενα του προβλήματος που πραγματεύεται η παρούσα διατριβή αφορούν την μοντελοποίηση του κύκλου παροχής ανάδρασης σε ευφυή εκπαιδευτικά συστήματα, την αναγνώριση της συναισθηματικής κατάστασης του χρήστη και την δυνατότητα κατανόησης κειμένου για επικοινωνία ανθρώπου-υπολογιστή σε φυσική γλώσσα. Αρχικά, παρουσιάζεται μια νέα μεθοδολογία δημιουργίας ανάδρασης σε ευφυή εκπαιδευτικά συστήματα, με στόχο την παροχή κατάλληλης καθοδήγησης κατά την διάρκεια της αλληλεπίδρασης. Η μεθοδολογία που αναπτύχθηκε περιλαμβάνει την εισαγωγή μιας γενικής μοντελοποίησης της απάντησης των εκπαιδευόμενων, την εισαγωγή ενός γενικού ιεραρχικού μοντέλου οργάνωσης της ανάδρασης σε επίπεδα καθώς και το καθορισμό της κατηγοριοποίησης των λαθών με βάση το πεδίο της εφαρμογής. Επίσης, αναπτύχθηκε ένας μηχανισμός για την παραγωγή ανάδρασης, που έχει ως στόχο να παράγει και να παρέχει αυτόματα τους κατάλληλους τύπους ανάδρασης με βάση το ιεραρχικό μοντέλο. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι το πλαίσιο που εισάγεται είναι ιδιαίτερα αποτελεσματικό. Για την κατανόηση κειμένου και την επικοινωνία σε φυσική γλώσσα, μια σημαντική συνεισφορά της διατριβής αποτελεί η εισαγωγή μιας νέας, καινοτόμου μεθοδολογίας για την αυτόματη μετατροπή φυσικής γλώσσας σε κατηγορηματική λογική πρώτης τάξης (first-order predicate logic), συντομογραφικά ΚΛΠΤ (FOPC). Η μεθοδολογία βασίζεται στη βασισμένη σε περιπτώσεις συλλογιστική (case-based reasoning) και στην αρχή ότι προτάσεις φυσικής γλώσσας που έχουν ίδια ή παρόμοια συντακτική δομή και δέντρα εξαρτήσεων (dependency trees) θα έχουν ίδια ή παρόμοια δομή έκφρασης σε κατηγορηματική λογική πρώτης τάξης. Για τον προσδιορισμό της ομοιότητας μεταξύ των προτάσεων φυσικής γλώσσας χρησιμοποιείται η απόσταση μετασχηματισμού δέντρου (tree edit distance), μετρική η οποία εφαρμόζεται στις δεντρικές δομές των δέντρων εξαρτήσεων. Επίσης, χρησιμοποιούνται κανόνες που έχουν ως στόχο να καθοριστεί η ακριβής έκφραση ΚΛΠΤ της νέας πρότασης. Τα πειραματικά αποτελέσματα έδειξαν ότι η προσέγγιση που εισάγεται είναι αποτελεσματική στις περιπτώσεις που η ομοιότητα είναι μεγάλη. Επίσης, εισάγεται μια προσέγγιση που σχεδιάστηκε για την ανάλυση των προτάσεων και τον προσδιορισμό του επιπέδου δυσκολίας της μετατροπής τους, η οποία βασίζεται σε χαρακτηριστικά της δομής των προτάσεων, στην ανάλυση των αντίστοιχων εκφράσεων ΚΛΠΤ, καθώς και σε χαρακτηριστικά που εξάγονται από την αντιστοίχισή τους. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι η προσέγγιση είναι ακριβής στον προσδιορισμό του κατάλληλου επιπέδου δυσκολίας, γεγονός που επαληθεύεται και από τις επιδόσεις του μηχανισμού αυτόματης μετατροπής. Ακόμη, εισάγεται μια μεθοδολογία για την παραγωγή λογικά ισοδύναμων προτάσεων (παραφράσεων), που βασίζεται σε ένα σύνολο από τεχνικές παράφρασης (paraphrasing techniques), οι οποίες μπορούν να τροποποιήσουν τη δομή προτάσεων και να μετατρέψουν δομικά μέρη του δέντρου εξάρτησης των προτάσεων σε ισοδύναμη μορφή. Τα πειραματικά αποτελέσματα της αξιολόγησης έδειξαν μια καλή απόδοση των τεχνικών και του εργαλείου που αναπτύχθηκε. Ένα άλλο βασικό αντικείμενο που πραγματεύεται η διατριβή είναι η αναγνώριση της συναισθηματικής κατάστασης του χρήστη. Για τον σκοπό αυτό, σχεδιάστηκαν και αναπτύχθηκαν μέθοδοι για την ανάλυση κειμένου και τον προσδιορισμό του συναισθηματικού περιεχομένου του καθώς και μέθοδοι ανάλυσης εκφράσεων προσώπου και αναγνώρισης της συναισθηματικής τους κατάστασης. Αρχικά, σχεδιάσαμε και αναπτύξαμε νέες προσεγγίσεις για την αυτόματη ανάλυση προτάσεων φυσικής γλώσσας και την εξαγωγή των συναισθηματικών πληροφοριών που φέρουν. Οι μέθοδοι που αναπτύχθηκαν βασίζονται σε σχήματα ομαδοποιημένων ταξινομητών (ensemble classifiers), που συνδυάζουν μεθόδους επεξεργασίας φυσικής γλώσσας και ανάλυσης των δομών των προτάσεων με μεθόδους μηχανικής μάθησης. Πιο συγκεκριμένα, εισάγεται μια βασισμένη σε γνώση (knowledge based) προσέγγιση, που βασίζεται στην εις βάθος ανάλυση των δομών των προτάσεων, και γίνεται προσδιορισμός του συναισθηματικού περιεχόμενο τους με βάση τη συντακτική δομή τους και λεξικολογικούς πόρους. Επίσης, γίνεται χρήση μεθόδων μηχανικής μάθησης μέσω χρήσης βασικών στατιστικών ταξινομητών, όπως ο απλοϊκός bayes (naïve Bayes) και οι μηχανές διανυσμάτων υποστήριξης (support vector machines), καθώς και συνδυασμός τους σε σχήμα ομαδοποιημένων ταξινομητών μαζί με τη βασισμένη στη γνώση προσέγγιση. Τα πειραματικά αποτελέσματα της αξιολόγησης έδειξαν ότι τα ομαδοποιημένα σχήματα παρουσίασαν μια αύξηση της απόδοσης κατά 4.8% έως 8.4% σε σχέση με τον καλύτερο ταξινομητή. Ως προς την αυτόματη ανάλυση εκφράσεων προσώπου και την αναγνώριση του συναισθηματικού τους περιεχομένου, αρχικά, εισάγεται ένα πλαίσιο μοντελοποίησης των εκφράσεων του προσώπου, το οποίο ακολουθεί μια αναλυτική, τοπικής εμβέλειας προσέγγιση και αναπαριστά μια έκφραση με 25 χαρακτηριστικά που εξάγει από σημεία όπως, τα μάτια, το στόμα και τα φρύδια. Στην συνέχεια, μελετάται η απόδοση νεύρο-ασαφούς προσέγγισης και μεθόδων μηχανικής μάθησης, όπως οι random forest και support vector machines, στον προσδιορισμό της ύπαρξης ή όχι συναισθημάτων σε μια έκφραση καθώς και στην αναγνώριση της ακριβούς συναισθηματικής της κατάστασης. Έπειτα, με βάση την απόδοση τους, παρουσιάζεται ομαδοποιημένο σχήμα ταξινόμησης, το οποίο συνδυάζει ταξινομητές που βασίζονται στις τρεις παραπάνω μεθόδους σε ένα σχήμα πλειοψηφίας. Στόχος του ομαδοποιημένου σχήματος αποτελεί η αύξηση της απόδοσης και η αποτελεσματική γενίκευση σε νέα δεδομένα εκφράσεων προσώπου. Τα αποτελέσματα της πειραματικής μελέτης έδειξαν ότι το ομαδοποιημένο σχήμα παρουσίασε μια αύξηση της απόδοσης της τάξης του 3.5% σε σχέση με τον καλύτερο ταξινομητή. Συμπερασματικά, οι τεχνικές που προτείνονται στην παρούσα διδακτορική διατριβή επεκτείνουν εργασίες της διεθνούς βιβλιογραφίας, προσθέτοντας και εισάγοντας νέες μεθόδους αντιμετώπισης στα θεματικά που πραγματεύεται.