Περίληψη: | Η αναγνώριση του συναισθηματικού περιεχομένου προτάσεων Φυσικής Γλώσσας μπορεί να βελτιώσει τον τρόπο επικοινωνίας του ανθρώπου με ένα υπολογιστικό σύστημα δίνοντας του την δυνατότητα να αναγνωρίσει (και να μιμηθεί) συναισθηματικές εκφράσεις. Ο τομέας της αναγνώρισης συναισθήματος κατέχει σημαντική θέση στις εφαρμογές της τεχνητής νοημοσύνης. Η ραγδαία αύξηση της δημοτικότητας των μέσων κοινωνικής δικτύωσης έχει δημιουργήσει την ανάγκη για την μελέτη και την καταγραφή της χρήσης τους. Κύρια αφορμή λοιπόν για την δημιουργία αυτής της εργασίας ήταν η μεγάλη άνοδος της δημοτικότητας των social media αλλά και η έλλειψη άντλησης ικανοποιητικού ποσό δεδομένων και πληροφοριών από τα ποστ των χρηστών. Στην παρούσα εργασία δοκιμάστηκαν τόσο κλασικοί αλγόριθμοι ταξινόμησης όσο και διάφορες αρχιτεκτονικές νευρωνικών δικτύων. Στο αρχικό στάδιο της έρευνας, γίνεται αναφορά σε πολλές state of the art τεχνικές που υπάρχουν ήδη στον συγκεκριμένο τομέα. Ύστερα, αναλύονται η τεχνικές που θα χρησιμοποιήσουμε στο γενικό τους πλαίσιο, αλλά και οι ειδικές μετατροπές που πρέπει να γίνουν ώστε να μπορέσουμε να τις χρησιμοποιήσουμε για την λύση του συγκεκριμένου προβλήματος. Στα πλαίσια της παρούσας διπλωματικής θα αναπτυχθεί μηχανισμός αναγνώρισης της συναισθηματική πληροφορίας που μεταφέρεται σε προτάσεις Φυσικής Γλώσσας. Το σύστημα που θα αναπτυχθεί, αρχικά, θα αναλύει την πρόταση Φυσικής Γλώσσας και θα εξάγει τις κατάλληλες πληροφορίες, όπως π.χ. δομή της πρότασης, λέξεις-κλειδιά που φέρουν συναισθηματική πληροφορία κ.α. Όλα αυτά θα γίνουν με γνωστές τεχνικές προεπεξεργασίας και μετατροπής των δεδομένων. Στην συνέχεια, το σύστημα, θα προσδιορίζει και θα κατηγοριοποιεί την ύπαρξη συναισθημάτων χρησιμοποιώντας τεχνικές μηχανικής μάθησης και τεχνικές βασισμένες στην γνώση. Μελετήθηκαν και αναλύθηκαν διάφορα μοντέλα μηχανικής μάθησης καθώς και διάφοροι συνδυασμοί αυτών των μοντέλων. Αρχικά χρησιμοποιήθηκαν διάφοροι κλασικοί αλγόριθμοι ταξινόμησης μηχανικής μάθησης και στην συνέχεια έγινε χρήση διάφορων ειδών νευρωνικών δικτύων. Έπειτα διεξήχθησαν πειράματα με την χρήση των μοντέλων αυτών σε μια πληθώρα από σύνολα δεδομένων, που έχουν χρησιμοποιηθεί σε προηγούμενες έρευνες και στο τέλος της έρευνας αξιολογήθηκαν όλες οι προσεγγίσεις, συγκρίθηκαν τα αποτελέσματα των πειραμάτων κάθε προσέγγισης με τις σχετικές εργασίες και έγιναν οι ανάλογες παρατηρήσεις. Κυρίως στόχος αποτελεί η μελέτη των ήδη υπαρχουσών τεχνικών και η προσπάθεια βελτίωσής τους, μέσω περαιτέρω εκπαίδευσης αλλά και μέσω της συνδυαστικής αξιοποίησης τους. Τα αποτελέσματα της έρευνας δείχνουν πως υπάρχουν περιθώρια για βελτίωση στον συγκεκριμένο τομέα, αλλά ταυτόχρονα αρκετά από τα μοντέλα, κυρίως τα συνδυαστικά, κατάφεραν να φτάσουν ή ακόμα και να ξεπεράσουν κάποιες από τις υπάρχουσες state of the art τεχνικές.
|