Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης

Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Νιαράκης, Νικόλαος
Άλλοι συγγραφείς: Niarakis, Nikolaos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23575
id nemertes-10889-23575
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Συναισθηματική ανάλυση
Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης
Sentiment analysis
Automated machine learning sentiment analysis model
spellingShingle Συναισθηματική ανάλυση
Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης
Sentiment analysis
Automated machine learning sentiment analysis model
Νιαράκης, Νικόλαος
Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
description Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συναισθήματά τους πιο ανοιχτά από ποτέ, η ανάλυση συναισθημάτων γίνεται γρήγορα ένα ουσιαστικό εργαλείο για την παρακολούθηση και την κατανόηση του συναισθήματος σε όλους τους τύπους δεδομένων. Με αυτόν τον τρόπο, αυτή η αυτοματοποιημένη διαδικασία αναγνώρισης απόψεων σ’ ένα κείμενο, δίνει τη δυνατότητα χαρακτηρισμού αυτών ως θετικές, αρνητικές ή ουδέτερες, με βάση τα συναισθήματα που εκφράζονται μέσα σε αυτές. Η συναισθηματική ανάλυση, πραγματοποιείται κυρίως σε δημόσιες κριτικές, πλατφόρμες μέσων κοινωνικής δικτύωσης και παρόμοιους ιστότοπους και σκοπό έχει να βοηθήσει τις επιχειρήσεις να παρακολουθούν το συναίσθημα της επωνυμίας και του προϊόντος στα σχόλια των πελατών και να κατανοήσουν τις ανάγκες αυτών. Τα tweets είναι συχνά χρήσιμα για τη δημιουργία ενός τεράστιου όγκου δεδομένων συναισθήματος κατά την ανάλυση. Αυτά τα δεδομένα είναι χρήσιμα για την κατανόηση απόψεων των ανθρώπων για μια ποικιλία θεμάτων. Επομένως, πρέπει να αναπτύξουμε ένα Αυτοματοποιημένο Μοντέλο Ανάλυσης Συναισθημάτων Μηχανικής Μάθησης προκειμένου να παρατηρήσουμε την αντίληψη του πελάτη. Λόγω της παρουσίας μη χρήσιμων χαρακτήρων (που συλλογικά ονομάζονται ως θόρυβος) μαζί με χρήσιμα δεδομένα, καθίσταται δύσκολη η εφαρμογή μοντέλων σε αυτούς. Στο πλαίσιο της παρούσας εργασίας, στοχεύουμε να αναλύσουμε το συναίσθημα των tweets που παρέχονται από το σύνολο δεδομένων Sentiment140 αναπτύσσοντας ένα μηχανισμό μηχανικής εκμάθησης που περιλαμβάνει τη χρήση τριών ταξινομητών (Logistic Regression, Bernoulli Naive Bayes και SVM) μαζί με τη χρήση Term Frequency- Inverse Document Frequency (TF-IDF). Στη συνέχεια, η απόδοση αυτών των ταξινομητών αξιολογείται χρησιμοποιώντας την ακρίβεια και τη μέτρηση F1.
author2 Niarakis, Nikolaos
author_facet Niarakis, Nikolaos
Νιαράκης, Νικόλαος
author Νιαράκης, Νικόλαος
author_sort Νιαράκης, Νικόλαος
title Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
title_short Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
title_full Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
title_fullStr Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
title_full_unstemmed Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης
title_sort αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (twitter) με μεθόδους μηχανικής μάθησης
publishDate 2022
url https://hdl.handle.net/10889/23575
work_keys_str_mv AT niarakēsnikolaos algorithmikēanalysēsynaisthēmatōnkoinōnikoudiktyoutwittermemethodousmēchanikēsmathēsēs
AT niarakēsnikolaos algorithmicsentimentanalysisofsocialnetworktwitterwithmachinelearningmethods
_version_ 1771297134295908352
spelling nemertes-10889-235752022-11-02T04:34:29Z Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης Algorithmic sentiment analysis of social network (Twitter) with machine learning methods Νιαράκης, Νικόλαος Niarakis, Nikolaos Συναισθηματική ανάλυση Αυτοματοποιημένο μοντέλο ανάλυσης συναισθημάτων μηχανικής μάθησης Sentiment analysis Automated machine learning sentiment analysis model Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συναισθήματά τους πιο ανοιχτά από ποτέ, η ανάλυση συναισθημάτων γίνεται γρήγορα ένα ουσιαστικό εργαλείο για την παρακολούθηση και την κατανόηση του συναισθήματος σε όλους τους τύπους δεδομένων. Με αυτόν τον τρόπο, αυτή η αυτοματοποιημένη διαδικασία αναγνώρισης απόψεων σ’ ένα κείμενο, δίνει τη δυνατότητα χαρακτηρισμού αυτών ως θετικές, αρνητικές ή ουδέτερες, με βάση τα συναισθήματα που εκφράζονται μέσα σε αυτές. Η συναισθηματική ανάλυση, πραγματοποιείται κυρίως σε δημόσιες κριτικές, πλατφόρμες μέσων κοινωνικής δικτύωσης και παρόμοιους ιστότοπους και σκοπό έχει να βοηθήσει τις επιχειρήσεις να παρακολουθούν το συναίσθημα της επωνυμίας και του προϊόντος στα σχόλια των πελατών και να κατανοήσουν τις ανάγκες αυτών. Τα tweets είναι συχνά χρήσιμα για τη δημιουργία ενός τεράστιου όγκου δεδομένων συναισθήματος κατά την ανάλυση. Αυτά τα δεδομένα είναι χρήσιμα για την κατανόηση απόψεων των ανθρώπων για μια ποικιλία θεμάτων. Επομένως, πρέπει να αναπτύξουμε ένα Αυτοματοποιημένο Μοντέλο Ανάλυσης Συναισθημάτων Μηχανικής Μάθησης προκειμένου να παρατηρήσουμε την αντίληψη του πελάτη. Λόγω της παρουσίας μη χρήσιμων χαρακτήρων (που συλλογικά ονομάζονται ως θόρυβος) μαζί με χρήσιμα δεδομένα, καθίσταται δύσκολη η εφαρμογή μοντέλων σε αυτούς. Στο πλαίσιο της παρούσας εργασίας, στοχεύουμε να αναλύσουμε το συναίσθημα των tweets που παρέχονται από το σύνολο δεδομένων Sentiment140 αναπτύσσοντας ένα μηχανισμό μηχανικής εκμάθησης που περιλαμβάνει τη χρήση τριών ταξινομητών (Logistic Regression, Bernoulli Naive Bayes και SVM) μαζί με τη χρήση Term Frequency- Inverse Document Frequency (TF-IDF). Στη συνέχεια, η απόδοση αυτών των ταξινομητών αξιολογείται χρησιμοποιώντας την ακρίβεια και τη μέτρηση F1. Sentiment analysis (or opinion mining) is a natural language processing (Natural Language Processing – NLP) technique, which refers to identifying as well as classifying the sentiments that are expressed in the text source. Since humans express their thoughts and feelings more openly than ever before, sentiment analysis is fast becoming an essential tool to monitor and understand sentiment in all types of data. Hence, this automated process of identifying opinions in text offers the labeling of them as positive, negative, or neutral, based on the emotions customers express within them. Sentiment analysis is often performed on textual data to help businesses monitor brand and product sentiment in customer feedback, and understand customer needs. Tweets are often useful in generating a vast amount of sentiment data upon analysis. These data are useful in understanding the opinion of the people about a variety of topics. Therefore, we need to develop an Automated Machine Learning Sentiment Analysis Model in order to compute the customer perception. Due to the presence of non-useful characters (collectively termed as the noise) along with useful data, it becomes difficult to implement models on them. In this work, we aim to analyze the sentiment of the tweets provided from the Sentiment140 dataset by developing a machine learning pipeline involving the use of three classifiers (Logistic Regression, Bernoulli Naive Bayes, and SVM) along with using Term Frequency- Inverse Document Frequency (TF-IDF). The performance of these classifiers is then evaluated using accuracy and F1 Scores. 2022-11-01T07:50:10Z 2022-11-01T07:50:10Z 2022-07-13 https://hdl.handle.net/10889/23575 el application/pdf