Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο

Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Δήμου, Ελένη
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9343
id nemertes-10889-9343
record_format dspace
spelling nemertes-10889-93432022-09-05T14:02:55Z Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο Δήμου, Ελένη Κωτσιαντής, Σωτήριος Γράψα, Θεοδούλα Ράγγος, Όμηρος Dimou, Eleni Ανάλυση συναισθήματος Πολικότητα κειμένου Μηχανική μάθηση Πολυωνυμικός «Αφελής» Bayes Μηχανές διανυσμάτων υποστήριξης Python Analysis Text polarity Machine learning Multinomial naive bayes Support vector machines SentiWordNet 3.0 Python 005.74 Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis). Στόχος της Ανάλυσης Συναισθήματος, είναι η ανίχνευση της πολικότητας ενός κειμένου, με σκοπό την εξαγωγή της υποκειμενικής άποψης του συγγραφέα, ως προς το θέμα του κειμένου. Στην παρούσα εργασία παρουσιάζεται μία συγκριτική μελέτη μοντέλων κατηγοριοποίησης συναισθήματος, δεδομένων που προέρχονται από ιστοσελίδες κριτικής ταινιών (IMDb, Rotten Tomatoes) και από το Twitter. Δύο αλγόριθμοι, από την Επιβλεπόμενη Μηχανική Μάθηση, αποτελούν τη βάση των ταξινομητών, ο Πολυωνυμικός «Αφελής» Bayes (Multinomial Naive Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM). Επιπρόσθετα, διερευνάται η μεταβολή ορισμένων παραμέτρων, με σκοπό τη βελτίωση της απόδοσης των μοντέλων. Τέλος, προτείνεται η ενσωμάτωση του λεξικού πόρου SentiWordNet 3.0, στο μοντέλο ταξινόμησης των δεδομένων από το Twitter, σε συνδυασμό με τον καθαρισμό των tweets και τη γλωσσολογική ανάλυση των μηνυμάτων, καθώς οδηγεί σε περαιτέρω βελτίωση του ταξινομητή. Τα μοντέλα κατηγοριοποίησης συναισθήματος υλοποιούνται στο προγραμματιστικό περιβάλλον της Python. The Internet bloom revealed new communication tools and channels of opinions exchange. The need to exploit, through automated techniques, the huge amount of data in text format, led to Text Mining and Sentiment Analysis. The Analysis Sentiment aims to detect the polarity of a text, in order to export the subjective opinion of the author on the topic. This paper presents a comparative study of sentiment classification models, on data derived from movie reviews websites (IMDb, Rotten Tomatoes) and from Twitter. In order to build our classifiers, we use two algorithms, from the Supervised Machine Learning (Multinomial Naive Bayes and Support Vector Machines). Moreover, we explore how to improve the effectiveness of the model, by varying certain parameters. Finally, we propose the incorporation of the dictionary SentiWordNet 3.0, along with cleaning tweets and linguistic analysis of messages, as improves the classifier's performance. The sentiment classification models implemented using Python. 2016-06-09T12:50:30Z 2016-06-09T12:50:30Z 2016-02-29 Thesis http://hdl.handle.net/10889/9343 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ανάλυση συναισθήματος
Πολικότητα κειμένου
Μηχανική μάθηση
Πολυωνυμικός «Αφελής» Bayes
Μηχανές διανυσμάτων υποστήριξης
Python
Analysis
Text polarity
Machine learning
Multinomial naive bayes
Support vector machines
SentiWordNet 3.0
Python
005.74
spellingShingle Ανάλυση συναισθήματος
Πολικότητα κειμένου
Μηχανική μάθηση
Πολυωνυμικός «Αφελής» Bayes
Μηχανές διανυσμάτων υποστήριξης
Python
Analysis
Text polarity
Machine learning
Multinomial naive bayes
Support vector machines
SentiWordNet 3.0
Python
005.74
Δήμου, Ελένη
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
description Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis). Στόχος της Ανάλυσης Συναισθήματος, είναι η ανίχνευση της πολικότητας ενός κειμένου, με σκοπό την εξαγωγή της υποκειμενικής άποψης του συγγραφέα, ως προς το θέμα του κειμένου. Στην παρούσα εργασία παρουσιάζεται μία συγκριτική μελέτη μοντέλων κατηγοριοποίησης συναισθήματος, δεδομένων που προέρχονται από ιστοσελίδες κριτικής ταινιών (IMDb, Rotten Tomatoes) και από το Twitter. Δύο αλγόριθμοι, από την Επιβλεπόμενη Μηχανική Μάθηση, αποτελούν τη βάση των ταξινομητών, ο Πολυωνυμικός «Αφελής» Bayes (Multinomial Naive Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM). Επιπρόσθετα, διερευνάται η μεταβολή ορισμένων παραμέτρων, με σκοπό τη βελτίωση της απόδοσης των μοντέλων. Τέλος, προτείνεται η ενσωμάτωση του λεξικού πόρου SentiWordNet 3.0, στο μοντέλο ταξινόμησης των δεδομένων από το Twitter, σε συνδυασμό με τον καθαρισμό των tweets και τη γλωσσολογική ανάλυση των μηνυμάτων, καθώς οδηγεί σε περαιτέρω βελτίωση του ταξινομητή. Τα μοντέλα κατηγοριοποίησης συναισθήματος υλοποιούνται στο προγραμματιστικό περιβάλλον της Python.
author2 Κωτσιαντής, Σωτήριος
author_facet Κωτσιαντής, Σωτήριος
Δήμου, Ελένη
format Thesis
author Δήμου, Ελένη
author_sort Δήμου, Ελένη
title Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
title_short Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
title_full Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
title_fullStr Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
title_full_unstemmed Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
title_sort μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο διαδίκτυο
publishDate 2016
url http://hdl.handle.net/10889/9343
work_keys_str_mv AT dēmouelenē meletēkaiaxiologēsētechnikōnkatēgoriopoiēsēssynaisthēmatossescholiachrēstōnstodiadiktyo
_version_ 1771297262737031168