Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/23575 |
id |
nemertes-10889-23575 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Συναισθηματική ανάλυση Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης Sentiment analysis Automated machine learning sentiment analysis model |
spellingShingle |
Συναισθηματική ανάλυση Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης Sentiment analysis Automated machine learning sentiment analysis model Νιαράκης, Νικόλαος Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
description |
Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό
καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συναισθήματά τους πιο ανοιχτά από ποτέ, η ανάλυση συναισθημάτων γίνεται γρήγορα ένα ουσιαστικό εργαλείο για την παρακολούθηση και την κατανόηση του συναισθήματος σε όλους τους τύπους δεδομένων. Με αυτόν τον τρόπο, αυτή η αυτοματοποιημένη διαδικασία αναγνώρισης απόψεων σ’ ένα κείμενο, δίνει τη δυνατότητα χαρακτηρισμού αυτών ως θετικές, αρνητικές ή ουδέτερες, με βάση τα συναισθήματα που εκφράζονται μέσα σε αυτές. Η συναισθηματική ανάλυση, πραγματοποιείται κυρίως σε δημόσιες κριτικές, πλατφόρμες μέσων κοινωνικής δικτύωσης και παρόμοιους ιστότοπους και σκοπό έχει να βοηθήσει τις επιχειρήσεις να παρακολουθούν το συναίσθημα της επωνυμίας και του προϊόντος στα σχόλια των πελατών και να κατανοήσουν τις ανάγκες αυτών. Τα tweets είναι συχνά χρήσιμα για τη δημιουργία ενός τεράστιου όγκου δεδομένων συναισθήματος κατά την ανάλυση. Αυτά τα δεδομένα είναι χρήσιμα για την κατανόηση απόψεων των ανθρώπων για μια ποικιλία θεμάτων. Επομένως, πρέπει να αναπτύξουμε ένα Αυτοματοποιημένο Μοντέλο Ανάλυσης Συναισθημάτων Μηχανικής Μάθησης προκειμένου να παρατηρήσουμε την αντίληψη του πελάτη. Λόγω της παρουσίας μη χρήσιμων χαρακτήρων (που συλλογικά ονομάζονται ως θόρυβος) μαζί με χρήσιμα δεδομένα, καθίσταται δύσκολη η εφαρμογή μοντέλων σε αυτούς. Στο πλαίσιο της παρούσας εργασίας, στοχεύουμε να αναλύσουμε το συναίσθημα των tweets που παρέχονται από το σύνολο δεδομένων Sentiment140 αναπτύσσοντας ένα μηχανισμό μηχανικής εκμάθησης που περιλαμβάνει τη χρήση τριών ταξινομητών (Logistic Regression, Bernoulli Naive Bayes και SVM) μαζί με τη χρήση Term Frequency- Inverse Document Frequency (TF-IDF). Στη συνέχεια, η απόδοση αυτών των ταξινομητών αξιολογείται χρησιμοποιώντας την ακρίβεια και τη μέτρηση F1. |
author2 |
Niarakis, Nikolaos |
author_facet |
Niarakis, Nikolaos Νιαράκης, Νικόλαος |
author |
Νιαράκης, Νικόλαος |
author_sort |
Νιαράκης, Νικόλαος |
title |
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
title_short |
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
title_full |
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
title_fullStr |
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
title_full_unstemmed |
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης |
title_sort |
αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (twitter) με μεθόδους μηχανικής μάθησης |
publishDate |
2022 |
url |
https://hdl.handle.net/10889/23575 |
work_keys_str_mv |
AT niarakēsnikolaos algorithmikēanalysēsynaisthēmatōnkoinōnikoudiktyoutwittermemethodousmēchanikēsmathēsēs AT niarakēsnikolaos algorithmicsentimentanalysisofsocialnetworktwitterwithmachinelearningmethods |
_version_ |
1771297134295908352 |
spelling |
nemertes-10889-235752022-11-02T04:34:29Z Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης Algorithmic sentiment analysis of social network (Twitter) with machine learning methods Νιαράκης, Νικόλαος Niarakis, Nikolaos Συναισθηματική ανάλυση Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης Sentiment analysis Automated machine learning sentiment analysis model Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συναισθήματά τους πιο ανοιχτά από ποτέ, η ανάλυση συναισθημάτων γίνεται γρήγορα ένα ουσιαστικό εργαλείο για την παρακολούθηση και την κατανόηση του συναισθήματος σε όλους τους τύπους δεδομένων. Με αυτόν τον τρόπο, αυτή η αυτοματοποιημένη διαδικασία αναγνώρισης απόψεων σ’ ένα κείμενο, δίνει τη δυνατότητα χαρακτηρισμού αυτών ως θετικές, αρνητικές ή ουδέτερες, με βάση τα συναισθήματα που εκφράζονται μέσα σε αυτές. Η συναισθηματική ανάλυση, πραγματοποιείται κυρίως σε δημόσιες κριτικές, πλατφόρμες μέσων κοινωνικής δικτύωσης και παρόμοιους ιστότοπους και σκοπό έχει να βοηθήσει τις επιχειρήσεις να παρακολουθούν το συναίσθημα της επωνυμίας και του προϊόντος στα σχόλια των πελατών και να κατανοήσουν τις ανάγκες αυτών. Τα tweets είναι συχνά χρήσιμα για τη δημιουργία ενός τεράστιου όγκου δεδομένων συναισθήματος κατά την ανάλυση. Αυτά τα δεδομένα είναι χρήσιμα για την κατανόηση απόψεων των ανθρώπων για μια ποικιλία θεμάτων. Επομένως, πρέπει να αναπτύξουμε ένα Αυτοματοποιημένο Μοντέλο Ανάλυσης Συναισθημάτων Μηχανικής Μάθησης προκειμένου να παρατηρήσουμε την αντίληψη του πελάτη. Λόγω της παρουσίας μη χρήσιμων χαρακτήρων (που συλλογικά ονομάζονται ως θόρυβος) μαζί με χρήσιμα δεδομένα, καθίσταται δύσκολη η εφαρμογή μοντέλων σε αυτούς. Στο πλαίσιο της παρούσας εργασίας, στοχεύουμε να αναλύσουμε το συναίσθημα των tweets που παρέχονται από το σύνολο δεδομένων Sentiment140 αναπτύσσοντας ένα μηχανισμό μηχανικής εκμάθησης που περιλαμβάνει τη χρήση τριών ταξινομητών (Logistic Regression, Bernoulli Naive Bayes και SVM) μαζί με τη χρήση Term Frequency- Inverse Document Frequency (TF-IDF). Στη συνέχεια, η απόδοση αυτών των ταξινομητών αξιολογείται χρησιμοποιώντας την ακρίβεια και τη μέτρηση F1. Sentiment analysis (or opinion mining) is a natural language processing (Natural Language Processing – NLP) technique, which refers to identifying as well as classifying the sentiments that are expressed in the text source. Since humans express their thoughts and feelings more openly than ever before, sentiment analysis is fast becoming an essential tool to monitor and understand sentiment in all types of data. Hence, this automated process of identifying opinions in text offers the labeling of them as positive, negative, or neutral, based on the emotions customers express within them. Sentiment analysis is often performed on textual data to help businesses monitor brand and product sentiment in customer feedback, and understand customer needs. Tweets are often useful in generating a vast amount of sentiment data upon analysis. These data are useful in understanding the opinion of the people about a variety of topics. Therefore, we need to develop an Automated Machine Learning Sentiment Analysis Model in order to compute the customer perception. Due to the presence of non-useful characters (collectively termed as the noise) along with useful data, it becomes difficult to implement models on them. In this work, we aim to analyze the sentiment of the tweets provided from the Sentiment140 dataset by developing a machine learning pipeline involving the use of three classifiers (Logistic Regression, Bernoulli Naive Bayes, and SVM) along with using Term Frequency- Inverse Document Frequency (TF-IDF). The performance of these classifiers is then evaluated using accuracy and F1 Scores. 2022-11-01T07:50:10Z 2022-11-01T07:50:10Z 2022-07-13 https://hdl.handle.net/10889/23575 el application/pdf |