Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης

Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ. Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γεωργίου, Αλέξανδρος
Άλλοι συγγραφείς: Μακρής, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2017
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10107
Περιγραφή
Περίληψη:Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ. Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευχθεί κατηγοριοποίηση δεδομένων που μπορεί να είναι ή όχι προηγουμένως ταξινομημένα και ομαδοποίηση τους βάσει μιας πλειάδας μεταβλητών. Στη συνέχεια μπορούν να απαντηθούν ερωτήματα βάσει αυτών των μεταβλητών και να βρεθούν τα δεδομένα που βρίσκονται στη μικρότερη απόσταση από το ερώτημα, δηλαδή το απαντούν πιο ικανοποιητικά από όλα. Οι τεχνικές αυτές, εφαρμοσμένες στα μέσα κοινωνικής δικτύωσης μπορούν να απαντήσουν σε ερωτήματα όπως ποιοι χρήστες είναι πιο κοινωνικοί, ποια θέματα έχουν ανερχόμενη δημοτικότητα, ποιο πληροφοριακό περιεχόμενο είναι ποιοτικό ή ποιος χρήστης θεωρείται πιο έμπιστος να παρέχει πληροφορίες για ένα συγκεκριμένο θέμα. Σκοπός της εργασίας είναι η παρουσίαση βασικών στοιχείων των μέσων κοινωνικής δικτύωσης και των τεχνικών εξόρυξης δεδομένων. Παρουσιάζονται οι αλγόριθμοι και οι τεχνικές που έχουν εφαρμοστεί στα μέσα κοινωνικής δικτύωσης για να απαντήσουν σε ερωτήματα αντίστοιχα με τα παραπάνω και τα αποτελέσματά τους. Τέλος, παρουσιάζεται αναλυτικά ένας νέος αλγόριθμος, με επιπλέον μετρικές και χρήση νέων τεχνικών για τη βελτίωση της εξόρυξης δεδομένων, για την εύρεση των πιο έμπιστων χρηστών γύρω από ένα θέμα και εκτίθενται τα πειραματικά αποτελέσματα από τη χρήση του αλγορίθμου αυτού. Ο αλγόριθμος αφορά την κατηγορία μέσων κοινωνικής δικτύωσης που λέγονται microblogs (πχ Twitter) όπου λόγω του περιορισμένου μεγέθους της πληροφορίας του κάθε μηνύματος πρέπει να αναζητηθούν παράμετροι του συνολικού κοινωνικού δικτύου που σχηματίζεται. Ο αλγόριθμος που προτείνεται προσθέτει μετρικές που αφορούν τη συχνότητα και τη χρονική ζώνη της ημέρας που ο χρήστης έχει δραστηριότητα και χρησιμοποιεί την τεχνική Cluster Based Fusion για να εξετάζονται τα βέλτιστα στοιχεία από κάθε cluster, βελτιώνοντας έτσι την ποιότητα της απάντησης.