Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter
Τα τελευταία 10 χρόνια η δραστηριότητα των χρηστών στα κοινωνικά δίκτυα έχει εκτοξευθεί σε υψηλά επίπεδα, με τον όγκο των δεδομένων να γίνεται τεράστιος. Οι ενεργοί χρήστες σε κάθε χώρα αυξάνονται συνεχώς, ενώ παράλληλα αυξάνεται και η συχνότητα με την οποία χρησιμοποιούν τις εφαρμογές κοινωνικής...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9432 |
id |
nemertes-10889-9432 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Κοινωνικά δίκτυα Εξόρυξη δεδομένων Hot topics detection Clustering Social network analysis 006.754 |
spellingShingle |
Κοινωνικά δίκτυα Εξόρυξη δεδομένων Hot topics detection Clustering Social network analysis 006.754 Δερματά, Ασημίνα Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
description |
Τα τελευταία 10 χρόνια η δραστηριότητα των χρηστών στα κοινωνικά δίκτυα έχει εκτοξευθεί σε υψηλά επίπεδα, με τον όγκο των δεδομένων να γίνεται τεράστιος. Οι ενεργοί χρήστες
σε κάθε χώρα αυξάνονται συνεχώς, ενώ παράλληλα αυξάνεται και η συχνότητα με την οποία
χρησιμοποιούν τις εφαρμογές κοινωνικής δικτύωσης, καθώς και ο χρόνος που παραμένουν συνδεδεμένοι σε αυτές. Η αυξανόμενη απασχόληση με το φαινόμενο της κοινωνικής δικτύωσης δημιουργεί πρόσφορο έδαφος για τη δημιουργία νέων κοινωνικών δικτύων, καθένα από τα οποία
παρέχει πληθώρα εργαλείων έκφρασης και επικοινωνίας στους χρήστες του. Ενδεικτικά, οι χρή-
στες μπορούν να συμμετέχουν σε online κοινότητες και ομάδες συζητήσεων, να εγγράφονται σε
λίστες ενημέρωσης ή ακόμα και να γράφουν οι ίδιοι κείμενα σε προσωπικούς λογαριασμούς και
ιστολόγια, με αποτέλεσμα να δημιουργείται ένας μεγάλος όγκος πληροφορίας, που δεν είναι
πάντα δυνατό να παρατηρηθεί και να μελετηθεί. Ένα από τα πιο δημοφιλή σύγχρονα κοινωνικά δίκτυα είναι τo Twitter, το οποίο αποτελεί το πιο
διαδεδομένο μέσο μικρών αναρτήσεων. Χαρακτηριστικά αναφέρεται ότι, στο πρώτο τρίμηνο του
2015 καταγράφει 302 εκατομμύρια ενεργούς χρήστες κατά μέσο όρο, ενώ οι εγγεγραμμένοι σε
αυτό χρήστες ξεπερνούν το 1 δισεκατομμύριο παγκοσμίως. Αυτό καθιστά το συγκεκριμένο
κοινωνικό δίκτυο ένα από τα μεγαλύτερα που υπάρχουν σήμερα και, ίσως, το πιο άμεσο και πιο
εύκολα προσβάσιμο δίκτυο επικοινωνίας και ενημέρωσης. Τα χαρακτηριστικά αυτά έχουν
επιφέρει μεγάλες αλλαγές στην καθημερινότητα πολλών χρηστών, με αποτέλεσμα να υπάρχει
μεγάλη ανάγκη, αλλά και πρόσφορο πεδίο έρευνας στο κομμάτι της αποδοτικής και γρήγορης
αξιοποίησης των δεδομένων για νέες υπηρεσίες και γνώση προς το χρήστη.
Για τους λόγους αυτούς, η μεταπτυχιακή εργασία πραγματεύεται τη διαχείριση των πληροφοριών που παρέχουν τα κοινωνικά δίκτυα γενικά, αλλά και το Twitter ειδικότερα, έχοντας ως αντικειμενικό σκοπό την εξεύρεση γνώσης και πληροφοριών, οι οποίες δεν είναι άμεσα ορατές από
έναν απλό χρήστη. Συγκεκριμένα, γίνεται μελέτη των δεδομένων των χρηστών με απώτερο σκοπό
τη δημιουργία ενός συστήματος, το οποίο μπορεί να εντοπίζει σε πραγματικό χρόνο τα δημοφιλή
θέματα (trending topics), που από τη φύση τους είναι πολύ σημαντικά, καθώς δίνουν άμεσα μια
εικόνα για το τι ενδιαφέρει τους ανθρώπους μια συγκεκριμένη χρονική στιγμή ή μια σύντομη
χρονική περίοδο. Επιπρόσθετα, το προτεινόμενο σύστημα ομαδοποιεί τα δημοφιλή θέματα σύμφωνα με τη σχετικότητα τους και το ρυθμό επανεμφάνισής τους κατά το χρονικό διάστημα ενδιαφέροντος. Το τελικό αποτέλεσμα είναι, για κάθε σημαντικό θέμα, ο χρήστης να μπορεί να δει
ομαδοποιημένα τα πιο σημαντικά μηνύματα χρηστών τα οποία όμως, έχουν καθαριστεί και οργανωθεί σύμφωνα με μια λίστα από μετρικές κοινωνικών δικτύων. Οι μετρικές αυτές αφορούν,
τόσο τα μηνύματα, αναφορικά με τη δραστηριότητα γύρω από αυτά και την πολικότητα του συναισθήματος που τα χαρακτηρίζει, όσο και τους ίδιους τους χρήστες. Οι μετρικές χρηστών μπορούν να αναδείξουν εκείνους τους χρήστες που έχουν μεγαλύτερο αντίκτυπο στο κοινωνικό δίκτυο γενικά και, ειδικότερα αναφορικά με το συγκεκριμένο θέμα συζήτησης.
Το κύριο χαρακτηριστικό της αρχιτεκτονικής του συστήματος είναι ότι επιτρέπει την ταυτόχρονη
εφαρμογή όλων των επιπέδων της, δηλαδή της συλλογής, ανάλυσης και αξιολόγησης, σε ένα
κοινό σύνολο δεδομένων σε πραγματικό χρόνο. Τελικώς, παρουσιάζονται τα πειραματικά
αποτελέσματα του συστήματος και, επιπλέον αναλύεται το προτεινόμενο σύστημα μαζί με τις
πιθανές επεκτάσεις του σε διάφορα επίπεδα.
Στα πλαίσια αυτής της μεταπτυχιακής εργασίας γίνεται επίσης έρευνα σε βάθος σχετικά με τα
κοινωνικά δίκτυα, και συγκεκριμένα το Twitter, τόσο αναφορικά με τις εφαρμογές τους, όσο και
με τις τεχνικές εξόρυξης δεδομένων που έχουν ξεχωρίσει. |
author2 |
Μακρής, Χρήστος |
author_facet |
Μακρής, Χρήστος Δερματά, Ασημίνα |
format |
Thesis |
author |
Δερματά, Ασημίνα |
author_sort |
Δερματά, Ασημίνα |
title |
Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
title_short |
Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
title_full |
Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
title_fullStr |
Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
title_full_unstemmed |
Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
title_sort |
τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter |
publishDate |
2016 |
url |
http://hdl.handle.net/10889/9432 |
work_keys_str_mv |
AT dermataasēmina technikesanalysēsaxiologēsēsdedomenōnapokoinōnikadiktyaepharmogēstotwitter |
_version_ |
1771297198971027456 |
spelling |
nemertes-10889-94322022-09-05T09:41:56Z Τεχνικές ανάλυσης & αξιολόγησης δεδομένων από κοινωνικά δίκτυα : εφαρμογή στο twitter Δερματά, Ασημίνα Μακρής, Χρήστος Τσακαλίδης, Αθανάσιος Χατζηλυγερούδης, Ιωάννης Dermata, Asimina Κοινωνικά δίκτυα Εξόρυξη δεδομένων Twitter Hot topics detection Clustering Social network analysis 006.754 Τα τελευταία 10 χρόνια η δραστηριότητα των χρηστών στα κοινωνικά δίκτυα έχει εκτοξευθεί σε υψηλά επίπεδα, με τον όγκο των δεδομένων να γίνεται τεράστιος. Οι ενεργοί χρήστες σε κάθε χώρα αυξάνονται συνεχώς, ενώ παράλληλα αυξάνεται και η συχνότητα με την οποία χρησιμοποιούν τις εφαρμογές κοινωνικής δικτύωσης, καθώς και ο χρόνος που παραμένουν συνδεδεμένοι σε αυτές. Η αυξανόμενη απασχόληση με το φαινόμενο της κοινωνικής δικτύωσης δημιουργεί πρόσφορο έδαφος για τη δημιουργία νέων κοινωνικών δικτύων, καθένα από τα οποία παρέχει πληθώρα εργαλείων έκφρασης και επικοινωνίας στους χρήστες του. Ενδεικτικά, οι χρή- στες μπορούν να συμμετέχουν σε online κοινότητες και ομάδες συζητήσεων, να εγγράφονται σε λίστες ενημέρωσης ή ακόμα και να γράφουν οι ίδιοι κείμενα σε προσωπικούς λογαριασμούς και ιστολόγια, με αποτέλεσμα να δημιουργείται ένας μεγάλος όγκος πληροφορίας, που δεν είναι πάντα δυνατό να παρατηρηθεί και να μελετηθεί. Ένα από τα πιο δημοφιλή σύγχρονα κοινωνικά δίκτυα είναι τo Twitter, το οποίο αποτελεί το πιο διαδεδομένο μέσο μικρών αναρτήσεων. Χαρακτηριστικά αναφέρεται ότι, στο πρώτο τρίμηνο του 2015 καταγράφει 302 εκατομμύρια ενεργούς χρήστες κατά μέσο όρο, ενώ οι εγγεγραμμένοι σε αυτό χρήστες ξεπερνούν το 1 δισεκατομμύριο παγκοσμίως. Αυτό καθιστά το συγκεκριμένο κοινωνικό δίκτυο ένα από τα μεγαλύτερα που υπάρχουν σήμερα και, ίσως, το πιο άμεσο και πιο εύκολα προσβάσιμο δίκτυο επικοινωνίας και ενημέρωσης. Τα χαρακτηριστικά αυτά έχουν επιφέρει μεγάλες αλλαγές στην καθημερινότητα πολλών χρηστών, με αποτέλεσμα να υπάρχει μεγάλη ανάγκη, αλλά και πρόσφορο πεδίο έρευνας στο κομμάτι της αποδοτικής και γρήγορης αξιοποίησης των δεδομένων για νέες υπηρεσίες και γνώση προς το χρήστη. Για τους λόγους αυτούς, η μεταπτυχιακή εργασία πραγματεύεται τη διαχείριση των πληροφοριών που παρέχουν τα κοινωνικά δίκτυα γενικά, αλλά και το Twitter ειδικότερα, έχοντας ως αντικειμενικό σκοπό την εξεύρεση γνώσης και πληροφοριών, οι οποίες δεν είναι άμεσα ορατές από έναν απλό χρήστη. Συγκεκριμένα, γίνεται μελέτη των δεδομένων των χρηστών με απώτερο σκοπό τη δημιουργία ενός συστήματος, το οποίο μπορεί να εντοπίζει σε πραγματικό χρόνο τα δημοφιλή θέματα (trending topics), που από τη φύση τους είναι πολύ σημαντικά, καθώς δίνουν άμεσα μια εικόνα για το τι ενδιαφέρει τους ανθρώπους μια συγκεκριμένη χρονική στιγμή ή μια σύντομη χρονική περίοδο. Επιπρόσθετα, το προτεινόμενο σύστημα ομαδοποιεί τα δημοφιλή θέματα σύμφωνα με τη σχετικότητα τους και το ρυθμό επανεμφάνισής τους κατά το χρονικό διάστημα ενδιαφέροντος. Το τελικό αποτέλεσμα είναι, για κάθε σημαντικό θέμα, ο χρήστης να μπορεί να δει ομαδοποιημένα τα πιο σημαντικά μηνύματα χρηστών τα οποία όμως, έχουν καθαριστεί και οργανωθεί σύμφωνα με μια λίστα από μετρικές κοινωνικών δικτύων. Οι μετρικές αυτές αφορούν, τόσο τα μηνύματα, αναφορικά με τη δραστηριότητα γύρω από αυτά και την πολικότητα του συναισθήματος που τα χαρακτηρίζει, όσο και τους ίδιους τους χρήστες. Οι μετρικές χρηστών μπορούν να αναδείξουν εκείνους τους χρήστες που έχουν μεγαλύτερο αντίκτυπο στο κοινωνικό δίκτυο γενικά και, ειδικότερα αναφορικά με το συγκεκριμένο θέμα συζήτησης. Το κύριο χαρακτηριστικό της αρχιτεκτονικής του συστήματος είναι ότι επιτρέπει την ταυτόχρονη εφαρμογή όλων των επιπέδων της, δηλαδή της συλλογής, ανάλυσης και αξιολόγησης, σε ένα κοινό σύνολο δεδομένων σε πραγματικό χρόνο. Τελικώς, παρουσιάζονται τα πειραματικά αποτελέσματα του συστήματος και, επιπλέον αναλύεται το προτεινόμενο σύστημα μαζί με τις πιθανές επεκτάσεις του σε διάφορα επίπεδα. Στα πλαίσια αυτής της μεταπτυχιακής εργασίας γίνεται επίσης έρευνα σε βάθος σχετικά με τα κοινωνικά δίκτυα, και συγκεκριμένα το Twitter, τόσο αναφορικά με τις εφαρμογές τους, όσο και με τις τεχνικές εξόρυξης δεδομένων που έχουν ξεχωρίσει. -- 2016-06-21T15:05:09Z 2016-06-21T15:05:09Z 2016-02 Thesis http://hdl.handle.net/10889/9432 gr 0 application/pdf |