Υπολογιστικά ζητήματα για γράφους του Twitter

Τα τελευταία χρόνια, λόγω των πολιτικών, κοινωνικών και στρατιωτικών εξελίξεων σε χώρες της Μέσης Ανατολής και της Βόρειας Αφρικής, το προσφυγικό ζήτημα αποτελεί ένα από τα μείζονα θέματα συζήτησης και προβληματισμού παγκοσμίως. Ένας από τους χώρους τέτοιων συζητήσεων είναι η υπηρεσία κοινωνικής δικ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παπασωτηρόπουλος, Γεώργιος
Άλλοι συγγραφείς: Μπουντουρίδης, Μωυσής
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10385
Περιγραφή
Περίληψη:Τα τελευταία χρόνια, λόγω των πολιτικών, κοινωνικών και στρατιωτικών εξελίξεων σε χώρες της Μέσης Ανατολής και της Βόρειας Αφρικής, το προσφυγικό ζήτημα αποτελεί ένα από τα μείζονα θέματα συζήτησης και προβληματισμού παγκοσμίως. Ένας από τους χώρους τέτοιων συζητήσεων είναι η υπηρεσία κοινωνικής δικτύωσης Twitter, η οποία δίνει τη δυνατότητα σε κάθε χρήστη (κάθε χώρας, κάθε γλώσσας) να μοιραστεί με άλλους τη γνώμη του σε όποιο θέμα επιλέξει, με ένα μόνο μήνυμα, το επονομαζόμενο "tweet". Το hashtag \#refugeeswelcome αποτέλεσε την μαζική, μέσω διαδικτύου, υποστήριξη των προσφύγων και ένα από τα πιο διαδεδομένα (με εκατομμύρια tweets) θέματα συζήτησης στο Twitter. Παρότι υπήρχαν καθημερινά χρήστες που μιλούσαν για αυτό, παρατηρήθηκαν κορυφώσεις τόσο κατά τη διάρκεια όσο και λίγο μετά από συγκεκριμένα γεγονότα. Για την παρούσα διπλωματική εργασία επιλέχθηκε το περιστατικό του πνιγμού του 3-χρονου, Συριακής καταγωγής, Κουρδικής εθνικότητας, Aylan Kurdi, την 2η Σεπτεμβρίου 2015 στη Μεσόγειο, στα παράλια της τουρκικής πόλης Bodrum (Αλικαρνασσός) που σχημάτισε το hashtag \#AylanKurdi. Στο πρώτο μέρος της παρούσας διπλωματικής εργασίας δίνεται μία συνοπτική περιγραφή της πολιτικής κατάστασης που προηγήθηκε του \#refugeeswelcome όπως επίσης και της υπόθεσης πίσω από το \#AylanKurdi, όπως αυτή καλύφθηκε από τα διεθνή Μέσα Μαζικής Ενημέρωσης. Ταυτόχρονα παρουσιάζεται μία σύντομη ανάλυση του ρόλου που έχουν ή που θα μπορούσαν να έχουν τα κοινωνικά δίκτυα στις κοινωνικές κινητοποιήσεις σήμερα. Το δεύτερο μέρος της εργασίας αποτέλεσε η συλλογή δεδομένων από το μέσο κοινωνικής δικτύωσης Twitter, η οπτικοποίηση και η περιγραφική στατιστική αυτών με τη βοήθεια των γλωσσών προγραμματισμού Python και Ruby, μέσα από τα υπολογιστικά περιβάλλοντα Jupyter, Beaker και Zeppelin Notebook. Σε αυτό αρχικά παρουσιάζονται οι μέθοδοι εξόρυξης δεδομένων από τα APIs που παρέχει το Twitter. Επειδή τα tweets του \#AylanKurdi συλλέχθηκαν ένα έτος μετά την εμφάνισή τους, το Web Scaping, μέσω της σύνθετης αναζήτησης του Twitter, ήταν αυτό που εφαρμόστηκε για τη συλλογή των δεδομένων. Συνολικά αποκτήθηκαν πάνω από 120 χιλιάδες tweets που όλα περιλάμβαναν το \#AylanKurdi και είχαν δημοσιευτεί στο διάστημα 2-20 Σεπτεμβρίου 2015. Από τα δεδομένα που περιείχαν τα tweets αυτά, παρουσιάζονται τα αποτελέσματα μίας στατιστικής ανάλυσης που έγινε και περιέχει τις χρονοσειρές (και τους χάρτες) για: το πλήθος των tweets, το πλήθος των tweets ανά χρήστη, το πλήθος των ανατροφοδοτούμενων tweets (retweets), το πλήθος των hashtags, το πλήθος των αναφορών χρηστών, το πλήθος των tweets ανά γλώσσα, το πλήθος των φωτογραφιών και βίντεο, το πλήθος των συχνότερα εμφανιζόμενων hashtags, ανάλυση συναισθήματος (ως προς την υποκειμενικότητα και την πόλωση) του περιεχομένου των tweets, χάρτες των τοποθεσιών προέλευσης των tweets. Το τρίτο μέρος της εργασίας αποτέλεσαν οι υπολογισμοί πάνω σε γράφους, μέσω της γλώσσας προγραμματισμού Python και του υπολογιστικού περιβάλλοντος Jupyter Notebook. Από τα hashtags και τις αναφορές χρηστών που συμπεριλάμβαναν τα tweets δημιουργήθηκαν αντίστοιχα οι γράφοι με βάρη ακμών: ένας μη κατευθυνόμενος γράφος και ένας κατευθυνόμενος γράφος, οι οποίοι μετά από αποκοπή σύμφωνα με τα βάρη ακμών τους (σε κάθε υπογράφο παρέμεναν μόνο οι ακμές -και οι κορυφές που αυτές ένωναν- με βάρος μεγαλύτερο από ένα δεδομένο) δημιούργησαν : 141 νέους μη κατευθυνόμενους γράφους συνεμφανιζόμενων hashtags και 19 νέους κατευθυνόμενους γράφους αναφορών χρηστών, στους οποίους έγιναν οι υπολογισμοί της θεωρίας γράφων για: την πυκνότητα γράφων, τις κατανομές των βαθμών κόμβων, τις συνδεδεμένες συνιστώσες των γράφων, τις κεντρικότητες κόμβων και τις κεντρικοποιήσεις των γράφων, την ταξινομησιμότητα βαθμού των γράφων, τον διαμερισμό σε κοινότητες των γράφων. Στο τελευταίο μέρος της εργασίας, βρίσκουμε την στατιστική συσχέτιση μεταξύ όλων των μεταβλητών που αναφέρθηκαν νωρίτερα. Στο παράρτημα δίνονται οι υπερδεσμοί για τους κώδικες που χρησιμοποιήθηκαν για όλους τους παραπάνω στατιστικούς και δικτυακούς υπολογισμούς.