Αλγοριθμική ανάλυση συναισθημάτων κοινωνικού δικτύου (Twitter) με μεθόδους μηχανικής μάθησης

Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Νιαράκης, Νικόλαος
Άλλοι συγγραφείς: Niarakis, Nikolaos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23575
Περιγραφή
Περίληψη:Η συναισθηματική ανάλυση (ή έκφραση απόψεων) είναι μια μια τεχνική επεξεργασίας φυσικής γλώσσας (Natural Language Processing – NLP), η οποία αναφέρεται στον εντοπισμό καθώς και στην ταξινόμηση των συναισθημάτων που εκφράζονται σ’ ένα κείμενο. Δεδομένου ότι οι άνθρωποι εκφράζουν τις σκέψεις και τα συναισθήματά τους πιο ανοιχτά από ποτέ, η ανάλυση συναισθημάτων γίνεται γρήγορα ένα ουσιαστικό εργαλείο για την παρακολούθηση και την κατανόηση του συναισθήματος σε όλους τους τύπους δεδομένων. Με αυτόν τον τρόπο, αυτή η αυτοματοποιημένη διαδικασία αναγνώρισης απόψεων σ’ ένα κείμενο, δίνει τη δυνατότητα χαρακτηρισμού αυτών ως θετικές, αρνητικές ή ουδέτερες, με βάση τα συναισθήματα που εκφράζονται μέσα σε αυτές. Η συναισθηματική ανάλυση, πραγματοποιείται κυρίως σε δημόσιες κριτικές, πλατφόρμες μέσων κοινωνικής δικτύωσης και παρόμοιους ιστότοπους και σκοπό έχει να βοηθήσει τις επιχειρήσεις να παρακολουθούν το συναίσθημα της επωνυμίας και του προϊόντος στα σχόλια των πελατών και να κατανοήσουν τις ανάγκες αυτών. Τα tweets είναι συχνά χρήσιμα για τη δημιουργία ενός τεράστιου όγκου δεδομένων συναισθήματος κατά την ανάλυση. Αυτά τα δεδομένα είναι χρήσιμα για την κατανόηση απόψεων των ανθρώπων για μια ποικιλία θεμάτων. Επομένως, πρέπει να αναπτύξουμε ένα Αυτοματοποιημένο Μοντέλο Ανάλυσης Συναισθημάτων Μηχανικής Μάθησης προκειμένου να παρατηρήσουμε την αντίληψη του πελάτη. Λόγω της παρουσίας μη χρήσιμων χαρακτήρων (που συλλογικά ονομάζονται ως θόρυβος) μαζί με χρήσιμα δεδομένα, καθίσταται δύσκολη η εφαρμογή μοντέλων σε αυτούς. Στο πλαίσιο της παρούσας εργασίας, στοχεύουμε να αναλύσουμε το συναίσθημα των tweets που παρέχονται από το σύνολο δεδομένων Sentiment140 αναπτύσσοντας ένα μηχανισμό μηχανικής εκμάθησης που περιλαμβάνει τη χρήση τριών ταξινομητών (Logistic Regression, Bernoulli Naive Bayes και SVM) μαζί με τη χρήση Term Frequency- Inverse Document Frequency (TF-IDF). Στη συνέχεια, η απόδοση αυτών των ταξινομητών αξιολογείται χρησιμοποιώντας την ακρίβεια και τη μέτρηση F1.