Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο

Οι κοινότητες πρακτικής αποτελούν συνεχώς αυξανόμενες κοινότητες ανταλλαγής γνώσεως στο διαδίκτυο, με το πρόβλημα της εφαρμογής μετρικών πάνω στα δεδομένα τους να κερδίζει όλο και περισσότερο ενδιαφέρον. Στα πλαίσια αυτής της εργασίας γίνεται μια πρώτη απόπειρα εφαρμογής της συναισθηματικής ανάλυσης...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Νάφας, Αλέξανδρος
Άλλοι συγγραφείς: Γαροφαλάκης, Ιωάννης
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10543
id nemertes-10889-10543
record_format dspace
spelling nemertes-10889-105432022-09-05T14:02:29Z Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο Sentiment analysis on question & answer communities in communities of practice Νάφας, Αλέξανδρος Γαροφαλάκης, Ιωάννης Μακρής, Χρήστος Χατζυληγερούδης, Ιωάννης Nafas, Alexandros Συναισθηματική ανάλυση Κοινότητες πρακτικής Sentiment analysis Communities of practice Stack exchange Stack overflow IMDB Weka Naive bayes .NET 025.042 072 1 Οι κοινότητες πρακτικής αποτελούν συνεχώς αυξανόμενες κοινότητες ανταλλαγής γνώσεως στο διαδίκτυο, με το πρόβλημα της εφαρμογής μετρικών πάνω στα δεδομένα τους να κερδίζει όλο και περισσότερο ενδιαφέρον. Στα πλαίσια αυτής της εργασίας γίνεται μια πρώτη απόπειρα εφαρμογής της συναισθηματικής ανάλυσης πάνω σε κοινότητες πρακτικής του διαδικτύου. Χρησιμοποιείται έτοιμο σύνολο δεδομένων κριτικών ταινιών από το Imdb, καθώς και δημιουργείται χειροκίνητα το πρώτο σύνολο δεδομένων από Stack Overflow. Υλοποιείται σε .NET ταξινομητής που βασίζεται στον αλγόριθμο Naive Bayes, σε συνδυασμό με έναν λεκτικό αναλυτή που υλοποιεί το μοντέλο bag-of-words. Επίσης, για σύγκριση υλοποιείται δεύτερος ταξινομητής ο οποίος χρησιμοποιεί τις βιβλιοθήκες του Weka, μεταφρασμένες σε .NET. Τέλος, οι δύο ταξινομητές μαζί με τα σύνολα δεδομένων ενσωματώνονται σε ήδη υπάρχουσα από προηγούμενη εργασία εφαρμογή, η οποία συνδέεται στο API του Stack Exchange και ανακτά δεδομένα σε πραγματικό χρόνο. Οι ταξινομητές δοκιμάζονται και αξιολογείται η απόδοση τους, η οποία κυμαίνεται από το 81% έως και το 86%. Communities of Practice are continuously growing knowledge-sharing communities on the web, with the problem of applying metrics to their data gaining more and more interest. In the context of this work, a first attempt is made to apply sentiment analysis on communities of practice. An already existing movie review dataset from Imdb is used, and the first Stack Overflow dataset is created manually. A classifier is implemented in .NET based on the Naive Bayes algorithm, combined with a tokenizer implementing the bag-of-words model. Also, for comparison, a second classifier is implemented using Weka libraries, translated into .NET. Finally, the two classifiers together with the datasets are integrated into an existing from previous work application, that connects to the Stack Exchange API and retrieves data real-time. Classifiers are tested and their performance is measured, ranging from 81% to 86%. 2017-08-24T11:02:07Z 2017-08-24T11:02:07Z 2017-06-01 Thesis http://hdl.handle.net/10889/10543 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Συναισθηματική ανάλυση
Κοινότητες πρακτικής
Sentiment analysis
Communities of practice
Stack exchange
Stack overflow
IMDB
Weka
Naive bayes
.NET
025.042 072 1
spellingShingle Συναισθηματική ανάλυση
Κοινότητες πρακτικής
Sentiment analysis
Communities of practice
Stack exchange
Stack overflow
IMDB
Weka
Naive bayes
.NET
025.042 072 1
Νάφας, Αλέξανδρος
Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
description Οι κοινότητες πρακτικής αποτελούν συνεχώς αυξανόμενες κοινότητες ανταλλαγής γνώσεως στο διαδίκτυο, με το πρόβλημα της εφαρμογής μετρικών πάνω στα δεδομένα τους να κερδίζει όλο και περισσότερο ενδιαφέρον. Στα πλαίσια αυτής της εργασίας γίνεται μια πρώτη απόπειρα εφαρμογής της συναισθηματικής ανάλυσης πάνω σε κοινότητες πρακτικής του διαδικτύου. Χρησιμοποιείται έτοιμο σύνολο δεδομένων κριτικών ταινιών από το Imdb, καθώς και δημιουργείται χειροκίνητα το πρώτο σύνολο δεδομένων από Stack Overflow. Υλοποιείται σε .NET ταξινομητής που βασίζεται στον αλγόριθμο Naive Bayes, σε συνδυασμό με έναν λεκτικό αναλυτή που υλοποιεί το μοντέλο bag-of-words. Επίσης, για σύγκριση υλοποιείται δεύτερος ταξινομητής ο οποίος χρησιμοποιεί τις βιβλιοθήκες του Weka, μεταφρασμένες σε .NET. Τέλος, οι δύο ταξινομητές μαζί με τα σύνολα δεδομένων ενσωματώνονται σε ήδη υπάρχουσα από προηγούμενη εργασία εφαρμογή, η οποία συνδέεται στο API του Stack Exchange και ανακτά δεδομένα σε πραγματικό χρόνο. Οι ταξινομητές δοκιμάζονται και αξιολογείται η απόδοση τους, η οποία κυμαίνεται από το 81% έως και το 86%.
author2 Γαροφαλάκης, Ιωάννης
author_facet Γαροφαλάκης, Ιωάννης
Νάφας, Αλέξανδρος
format Thesis
author Νάφας, Αλέξανδρος
author_sort Νάφας, Αλέξανδρος
title Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
title_short Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
title_full Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
title_fullStr Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
title_full_unstemmed Μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (CQA) σε κοινότητες πρακτικές στον διαδίκτυο
title_sort μηχανισμός ανάλυσης συναισθημάτων σε συστήματα ερωτήσεων και απαντήσεων (cqa) σε κοινότητες πρακτικές στον διαδίκτυο
publishDate 2017
url http://hdl.handle.net/10889/10543
work_keys_str_mv AT naphasalexandros mēchanismosanalysēssynaisthēmatōnsesystēmataerōtēseōnkaiapantēseōncqasekoinotētespraktikesstondiadiktyo
AT naphasalexandros sentimentanalysisonquestionanswercommunitiesincommunitiesofpractice
_version_ 1801184883594231808