Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets

Τα κοινωνικά μέσα δικτύωσης παράγουν τεράστια ποσά δεδομένων κάθε λεπτό, γεγονός το οποίο οφείλεται στη μεγάλη υιοθέτηση και καθημερινή χρήση τους τα τελευταία χρόνια. Έχει δημιουργηθεί λοιπόν η ανάγκη για ευρύτερη αξιοποίησή τους σε διάφορους τομείς της κοινωνικής επιχειρηματικής ζωής. Γι’ αυτό το...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Θηβαίος, Γιάννης
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10878
id nemertes-10889-10878
record_format dspace
spelling nemertes-10889-108782022-09-05T14:07:14Z Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets Study and evaluation of text mining techniques in tweets for politics Θηβαίος, Γιάννης Κωτσιαντής, Σωτήριος Κωτσιαντής, Σωτήριος Καββαδίας, Δημήτριος Γράψα, Θεοδούλα Thibaios, Giannis Εξόρυξη κειμένου Τουίτερ Μηχανική μάθηση Ανάλυση συναισθήματος Αφελής Bayes Μηχανές διανυσμάτων υποστήριξης Text mining Twitter Machine learning Sentiment analysis Naive Bayes Support vector machines Orange Python 006.312 Τα κοινωνικά μέσα δικτύωσης παράγουν τεράστια ποσά δεδομένων κάθε λεπτό, γεγονός το οποίο οφείλεται στη μεγάλη υιοθέτηση και καθημερινή χρήση τους τα τελευταία χρόνια. Έχει δημιουργηθεί λοιπόν η ανάγκη για ευρύτερη αξιοποίησή τους σε διάφορους τομείς της κοινωνικής επιχειρηματικής ζωής. Γι’ αυτό το λόγο δημιουργήθηκαν τεχνικές και αλγόριθμοι για την επεξεργασία κειμένων, όπως η εξόρυξη κειμένου (Text Mining) και η Ανάλυση Συναισθήματος (Sentiment Analysis). Στην παρούσα εργασία, έχουμε συλλέξει ένα σύνολο δεδομένων από το Twitter, για τους 2 βασικούς υποψηφίους των τελευταίων αμερικανικών εκλογών (Donald Trump, Hillary Clinton). Με χρήση τεχνικών επεξεργασίας των κειμένων, προσπαθούμε να βρούμε «δημοφιλείς» λέξεις για κάθε υποψήφιο και να δημιουργήσουμε ένα μηχανισμό πρόβλεψης, με βάση τον οποίο ένα τυχαίο tweet να κατηγοριοποιείται για έναν από τους δύο υποψηφίους ως θετικό ή αρνητικό. Δύο αλγόριθμοι επιβλεπόμενης μάθησης, ο ‘αφελής’ Bayes (Naïve Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM) αποτελούν τη βάση για την παραγωγή των ταξινομητών πρόβλεψης και των οποίων την ακρίβεια συγκρίνουμε. Για την προεπεξεργασία και την εφαρμογή των αλγόριθμων χρησιμοποιείται η βιβλιοθήκη sklearn της Python. Επιπλέον, κάνουμε μια προεπισκόπηση στο εργαλείο Orange3 και ακολουθούμε μια παρεμφερής διαδικασία ανάλυσης του συνόλου δεδομένων και αξιολογούμε την ευχρηστία και την απόδοση του συγκεκριμένου εργαλείου. Social networks generate every minute huge amounts of data, which occurs due to their large adoption and daily use in recent years. The need for wider use in various areas of social business life has been created. For this reason, techniques and algorithms for text processing, such as Text Mining and Sentiment Analysis, have been developed. In this paper, we have collected a set of data from Twitter for the two key candidates in the last US election (Donald Trump, Hillary Clinton). Using text processing algorithms, we try to find "popular" words for each candidate and create a prediction mechanism, according to which a random tweet is categorized as one of the two candidates as positive or negative. Two supervised learning algorithms, Naïve Bayes and Support Vector Machines (SVM) are the basis for the production of predictive classifiers and the accuracy of them. The Python sklearn library is used to pre-process and apply algorithms. In addition, we preview the Orange3 tool and follow the same process of analyzing the dataset and evaluate the usability and performance of the tool. 2018-01-04T08:01:41Z 2018-01-04T08:01:41Z 2017-08-22 Thesis http://hdl.handle.net/10889/10878 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Εξόρυξη κειμένου
Τουίτερ
Μηχανική μάθηση
Ανάλυση συναισθήματος
Αφελής Bayes
Μηχανές διανυσμάτων υποστήριξης
Text mining
Twitter
Machine learning
Sentiment analysis
Naive Bayes
Support vector machines
Orange
Python
006.312
spellingShingle Εξόρυξη κειμένου
Τουίτερ
Μηχανική μάθηση
Ανάλυση συναισθήματος
Αφελής Bayes
Μηχανές διανυσμάτων υποστήριξης
Text mining
Twitter
Machine learning
Sentiment analysis
Naive Bayes
Support vector machines
Orange
Python
006.312
Θηβαίος, Γιάννης
Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
description Τα κοινωνικά μέσα δικτύωσης παράγουν τεράστια ποσά δεδομένων κάθε λεπτό, γεγονός το οποίο οφείλεται στη μεγάλη υιοθέτηση και καθημερινή χρήση τους τα τελευταία χρόνια. Έχει δημιουργηθεί λοιπόν η ανάγκη για ευρύτερη αξιοποίησή τους σε διάφορους τομείς της κοινωνικής επιχειρηματικής ζωής. Γι’ αυτό το λόγο δημιουργήθηκαν τεχνικές και αλγόριθμοι για την επεξεργασία κειμένων, όπως η εξόρυξη κειμένου (Text Mining) και η Ανάλυση Συναισθήματος (Sentiment Analysis). Στην παρούσα εργασία, έχουμε συλλέξει ένα σύνολο δεδομένων από το Twitter, για τους 2 βασικούς υποψηφίους των τελευταίων αμερικανικών εκλογών (Donald Trump, Hillary Clinton). Με χρήση τεχνικών επεξεργασίας των κειμένων, προσπαθούμε να βρούμε «δημοφιλείς» λέξεις για κάθε υποψήφιο και να δημιουργήσουμε ένα μηχανισμό πρόβλεψης, με βάση τον οποίο ένα τυχαίο tweet να κατηγοριοποιείται για έναν από τους δύο υποψηφίους ως θετικό ή αρνητικό. Δύο αλγόριθμοι επιβλεπόμενης μάθησης, ο ‘αφελής’ Bayes (Naïve Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM) αποτελούν τη βάση για την παραγωγή των ταξινομητών πρόβλεψης και των οποίων την ακρίβεια συγκρίνουμε. Για την προεπεξεργασία και την εφαρμογή των αλγόριθμων χρησιμοποιείται η βιβλιοθήκη sklearn της Python. Επιπλέον, κάνουμε μια προεπισκόπηση στο εργαλείο Orange3 και ακολουθούμε μια παρεμφερής διαδικασία ανάλυσης του συνόλου δεδομένων και αξιολογούμε την ευχρηστία και την απόδοση του συγκεκριμένου εργαλείου.
author2 Κωτσιαντής, Σωτήριος
author_facet Κωτσιαντής, Σωτήριος
Θηβαίος, Γιάννης
format Thesis
author Θηβαίος, Γιάννης
author_sort Θηβαίος, Γιάννης
title Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
title_short Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
title_full Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
title_fullStr Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
title_full_unstemmed Μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
title_sort μελέτη και αξιολόγηση τεχνικών εξόρυξης πολιτικής γνώμης σε tweets
publishDate 2018
url http://hdl.handle.net/10889/10878
work_keys_str_mv AT thēbaiosgiannēs meletēkaiaxiologēsētechnikōnexoryxēspolitikēsgnōmēssetweets
AT thēbaiosgiannēs studyandevaluationoftextminingtechniquesintweetsforpolitics
_version_ 1771297256532606976