Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο
Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9343 |
id |
nemertes-10889-9343 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-93432022-09-05T14:02:55Z Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο Δήμου, Ελένη Κωτσιαντής, Σωτήριος Γράψα, Θεοδούλα Ράγγος, Όμηρος Dimou, Eleni Ανάλυση συναισθήματος Πολικότητα κειμένου Μηχανική μάθηση Πολυωνυμικός «Αφελής» Bayes Μηχανές διανυσμάτων υποστήριξης Python Analysis Text polarity Machine learning Multinomial naive bayes Support vector machines SentiWordNet 3.0 Python 005.74 Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis). Στόχος της Ανάλυσης Συναισθήματος, είναι η ανίχνευση της πολικότητας ενός κειμένου, με σκοπό την εξαγωγή της υποκειμενικής άποψης του συγγραφέα, ως προς το θέμα του κειμένου. Στην παρούσα εργασία παρουσιάζεται μία συγκριτική μελέτη μοντέλων κατηγοριοποίησης συναισθήματος, δεδομένων που προέρχονται από ιστοσελίδες κριτικής ταινιών (IMDb, Rotten Tomatoes) και από το Twitter. Δύο αλγόριθμοι, από την Επιβλεπόμενη Μηχανική Μάθηση, αποτελούν τη βάση των ταξινομητών, ο Πολυωνυμικός «Αφελής» Bayes (Multinomial Naive Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM). Επιπρόσθετα, διερευνάται η μεταβολή ορισμένων παραμέτρων, με σκοπό τη βελτίωση της απόδοσης των μοντέλων. Τέλος, προτείνεται η ενσωμάτωση του λεξικού πόρου SentiWordNet 3.0, στο μοντέλο ταξινόμησης των δεδομένων από το Twitter, σε συνδυασμό με τον καθαρισμό των tweets και τη γλωσσολογική ανάλυση των μηνυμάτων, καθώς οδηγεί σε περαιτέρω βελτίωση του ταξινομητή. Τα μοντέλα κατηγοριοποίησης συναισθήματος υλοποιούνται στο προγραμματιστικό περιβάλλον της Python. The Internet bloom revealed new communication tools and channels of opinions exchange. The need to exploit, through automated techniques, the huge amount of data in text format, led to Text Mining and Sentiment Analysis. The Analysis Sentiment aims to detect the polarity of a text, in order to export the subjective opinion of the author on the topic. This paper presents a comparative study of sentiment classification models, on data derived from movie reviews websites (IMDb, Rotten Tomatoes) and from Twitter. In order to build our classifiers, we use two algorithms, from the Supervised Machine Learning (Multinomial Naive Bayes and Support Vector Machines). Moreover, we explore how to improve the effectiveness of the model, by varying certain parameters. Finally, we propose the incorporation of the dictionary SentiWordNet 3.0, along with cleaning tweets and linguistic analysis of messages, as improves the classifier's performance. The sentiment classification models implemented using Python. 2016-06-09T12:50:30Z 2016-06-09T12:50:30Z 2016-02-29 Thesis http://hdl.handle.net/10889/9343 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ανάλυση συναισθήματος Πολικότητα κειμένου Μηχανική μάθηση Πολυωνυμικός «Αφελής» Bayes Μηχανές διανυσμάτων υποστήριξης Python Analysis Text polarity Machine learning Multinomial naive bayes Support vector machines SentiWordNet 3.0 Python 005.74 |
spellingShingle |
Ανάλυση συναισθήματος Πολικότητα κειμένου Μηχανική μάθηση Πολυωνυμικός «Αφελής» Bayes Μηχανές διανυσμάτων υποστήριξης Python Analysis Text polarity Machine learning Multinomial naive bayes Support vector machines SentiWordNet 3.0 Python 005.74 Δήμου, Ελένη Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
description |
Η άνθηση του διαδικτύου ανέδειξε νέα εργαλεία επικοινωνίας και διαύλους ανταλλαγής απόψεων. Η ανάγκη αξιοποίησης, μέσω αυτοματοποιημένων τεχνικών, του τεράστιου όγκου δεδομένων σε μορφή κειμένου, οδήγησε στην Εξόρυξη Γνώσης από Κείμενο (Text Mining) και στην Ανάλυση Συναισθήματος (Sentiment Analysis). Στόχος της Ανάλυσης Συναισθήματος, είναι η ανίχνευση της πολικότητας ενός κειμένου, με σκοπό την εξαγωγή της υποκειμενικής άποψης του συγγραφέα, ως προς το θέμα του κειμένου. Στην παρούσα εργασία παρουσιάζεται μία συγκριτική μελέτη μοντέλων κατηγοριοποίησης συναισθήματος, δεδομένων που προέρχονται από ιστοσελίδες κριτικής ταινιών (IMDb, Rotten Tomatoes) και από το Twitter. Δύο αλγόριθμοι, από την Επιβλεπόμενη Μηχανική Μάθηση, αποτελούν τη βάση των ταξινομητών, ο Πολυωνυμικός «Αφελής» Bayes (Multinomial Naive Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM). Επιπρόσθετα, διερευνάται η μεταβολή ορισμένων παραμέτρων, με σκοπό τη βελτίωση της απόδοσης των μοντέλων. Τέλος, προτείνεται η ενσωμάτωση του λεξικού πόρου SentiWordNet 3.0, στο μοντέλο ταξινόμησης των δεδομένων από το Twitter, σε συνδυασμό με τον καθαρισμό των tweets και τη γλωσσολογική ανάλυση των μηνυμάτων, καθώς οδηγεί σε περαιτέρω βελτίωση του ταξινομητή. Τα μοντέλα κατηγοριοποίησης συναισθήματος υλοποιούνται στο προγραμματιστικό περιβάλλον της Python. |
author2 |
Κωτσιαντής, Σωτήριος |
author_facet |
Κωτσιαντής, Σωτήριος Δήμου, Ελένη |
format |
Thesis |
author |
Δήμου, Ελένη |
author_sort |
Δήμου, Ελένη |
title |
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
title_short |
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
title_full |
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
title_fullStr |
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
title_full_unstemmed |
Μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο Διαδίκτυο |
title_sort |
μελέτη και αξιολόγηση τεχνικών κατηγοριοποίησης συναισθήματος σε σχόλια χρηστών στο διαδίκτυο |
publishDate |
2016 |
url |
http://hdl.handle.net/10889/9343 |
work_keys_str_mv |
AT dēmouelenē meletēkaiaxiologēsētechnikōnkatēgoriopoiēsēssynaisthēmatossescholiachrēstōnstodiadiktyo |
_version_ |
1771297262737031168 |