Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης
Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ. Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10107 |
id |
nemertes-10889-10107 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξη δεδομένων Κοινωνικά δίκτυα Data mining Social networks 006.312 |
spellingShingle |
Εξόρυξη δεδομένων Κοινωνικά δίκτυα Data mining Social networks 006.312 Γεωργίου, Αλέξανδρος Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
description |
Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ.
Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευχθεί κατηγοριοποίηση δεδομένων που μπορεί να είναι ή όχι προηγουμένως ταξινομημένα και ομαδοποίηση τους βάσει μιας πλειάδας μεταβλητών. Στη συνέχεια μπορούν να απαντηθούν ερωτήματα βάσει αυτών των μεταβλητών και να βρεθούν τα δεδομένα που βρίσκονται στη μικρότερη απόσταση από το ερώτημα, δηλαδή το απαντούν πιο ικανοποιητικά από όλα. Οι τεχνικές αυτές, εφαρμοσμένες στα μέσα κοινωνικής δικτύωσης μπορούν να απαντήσουν σε ερωτήματα όπως ποιοι χρήστες είναι πιο κοινωνικοί, ποια θέματα έχουν ανερχόμενη δημοτικότητα, ποιο πληροφοριακό περιεχόμενο είναι ποιοτικό ή ποιος χρήστης θεωρείται πιο έμπιστος να παρέχει πληροφορίες για ένα συγκεκριμένο θέμα.
Σκοπός της εργασίας είναι η παρουσίαση βασικών στοιχείων των μέσων κοινωνικής δικτύωσης και των τεχνικών εξόρυξης δεδομένων. Παρουσιάζονται οι αλγόριθμοι και οι τεχνικές που έχουν εφαρμοστεί στα μέσα κοινωνικής δικτύωσης για να απαντήσουν σε ερωτήματα αντίστοιχα με τα παραπάνω και τα αποτελέσματά τους.
Τέλος, παρουσιάζεται αναλυτικά ένας νέος αλγόριθμος, με επιπλέον μετρικές και χρήση νέων τεχνικών για τη βελτίωση της εξόρυξης δεδομένων, για την εύρεση των πιο έμπιστων χρηστών γύρω από ένα θέμα και εκτίθενται τα πειραματικά αποτελέσματα από τη χρήση του αλγορίθμου αυτού. Ο αλγόριθμος αφορά την κατηγορία μέσων κοινωνικής δικτύωσης που λέγονται microblogs (πχ Twitter) όπου λόγω του περιορισμένου μεγέθους της πληροφορίας του κάθε μηνύματος πρέπει να αναζητηθούν παράμετροι του συνολικού κοινωνικού δικτύου που σχηματίζεται. Ο αλγόριθμος που προτείνεται προσθέτει μετρικές που αφορούν τη συχνότητα και τη χρονική ζώνη της ημέρας που ο χρήστης έχει δραστηριότητα και χρησιμοποιεί την τεχνική Cluster Based Fusion για να εξετάζονται τα βέλτιστα στοιχεία από κάθε cluster, βελτιώνοντας έτσι την ποιότητα της απάντησης. |
author2 |
Μακρής, Χρήστος |
author_facet |
Μακρής, Χρήστος Γεωργίου, Αλέξανδρος |
format |
Thesis |
author |
Γεωργίου, Αλέξανδρος |
author_sort |
Γεωργίου, Αλέξανδρος |
title |
Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
title_short |
Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
title_full |
Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
title_fullStr |
Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
title_full_unstemmed |
Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
title_sort |
τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης |
publishDate |
2017 |
url |
http://hdl.handle.net/10889/10107 |
work_keys_str_mv |
AT geōrgioualexandros technikesexoryxēsplērophoriassemesakoinōnikēsdiktyōsēs AT geōrgioualexandros dataminingtechniquesinsocialnetworkingmedia |
_version_ |
1771297346279178240 |
spelling |
nemertes-10889-101072022-09-05T20:14:30Z Τεχνικές εξόρυξης πληροφορίας σε μέσα κοινωνικής δικτύωσης Data mining techniques in social networking media Γεωργίου, Αλέξανδρος Μακρής, Χρήστος Μακρής, Χρήστος Τσακαλίδης, Αθανάσιος Γαροφαλάκης, Ιωάννης Georgiou, Alexandros Εξόρυξη δεδομένων Κοινωνικά δίκτυα Data mining Social networks 006.312 Τα μέσα κοινωνικής δικτύωσης είναι πλατφόρμες επικοινωνίας όπου οι χρήστες ανταλλάσουν πληροφορίες και συνδέονται μεταξύ τους με σχέσεις που δημιουργούν κοινωνικά δίκτυα. Γνωστά τέτοια μέσα είναι το Facebook, το Twitter, το LinkedIn κλπ. Οι τεχνικές εξόρυξης δεδομένων χρησιμοποιούνται για να επιτευχθεί κατηγοριοποίηση δεδομένων που μπορεί να είναι ή όχι προηγουμένως ταξινομημένα και ομαδοποίηση τους βάσει μιας πλειάδας μεταβλητών. Στη συνέχεια μπορούν να απαντηθούν ερωτήματα βάσει αυτών των μεταβλητών και να βρεθούν τα δεδομένα που βρίσκονται στη μικρότερη απόσταση από το ερώτημα, δηλαδή το απαντούν πιο ικανοποιητικά από όλα. Οι τεχνικές αυτές, εφαρμοσμένες στα μέσα κοινωνικής δικτύωσης μπορούν να απαντήσουν σε ερωτήματα όπως ποιοι χρήστες είναι πιο κοινωνικοί, ποια θέματα έχουν ανερχόμενη δημοτικότητα, ποιο πληροφοριακό περιεχόμενο είναι ποιοτικό ή ποιος χρήστης θεωρείται πιο έμπιστος να παρέχει πληροφορίες για ένα συγκεκριμένο θέμα. Σκοπός της εργασίας είναι η παρουσίαση βασικών στοιχείων των μέσων κοινωνικής δικτύωσης και των τεχνικών εξόρυξης δεδομένων. Παρουσιάζονται οι αλγόριθμοι και οι τεχνικές που έχουν εφαρμοστεί στα μέσα κοινωνικής δικτύωσης για να απαντήσουν σε ερωτήματα αντίστοιχα με τα παραπάνω και τα αποτελέσματά τους. Τέλος, παρουσιάζεται αναλυτικά ένας νέος αλγόριθμος, με επιπλέον μετρικές και χρήση νέων τεχνικών για τη βελτίωση της εξόρυξης δεδομένων, για την εύρεση των πιο έμπιστων χρηστών γύρω από ένα θέμα και εκτίθενται τα πειραματικά αποτελέσματα από τη χρήση του αλγορίθμου αυτού. Ο αλγόριθμος αφορά την κατηγορία μέσων κοινωνικής δικτύωσης που λέγονται microblogs (πχ Twitter) όπου λόγω του περιορισμένου μεγέθους της πληροφορίας του κάθε μηνύματος πρέπει να αναζητηθούν παράμετροι του συνολικού κοινωνικού δικτύου που σχηματίζεται. Ο αλγόριθμος που προτείνεται προσθέτει μετρικές που αφορούν τη συχνότητα και τη χρονική ζώνη της ημέρας που ο χρήστης έχει δραστηριότητα και χρησιμοποιεί την τεχνική Cluster Based Fusion για να εξετάζονται τα βέλτιστα στοιχεία από κάθε cluster, βελτιώνοντας έτσι την ποιότητα της απάντησης. Social network media are communication platforms where users exchange information and get interconnected with relations that form social networks. Famous social network media are Facebook, Twitter, Linkedin, etc. Data mining techniques are used to achieve classification of data that may or may not be formerly ranked, and to achieve grouping of the data based on a variety of variables. Subsequently, queries can be answered based on these variables and data can be retrieved with respect to the smallest distance from the query. These techniques, when applied to social network media platforms, may answer to queries about the popularity of users and topics, the quality of information content or even the reliability of the information provided by certain users on specific topics. The goal of this thesis is to present basic elements of social network media platforms and data mining techniques. Algorithms and techniques that have been applied on social network media environments are presented along with evaluation results. Finally, a new algorithm is presented which employs extra metrics and the use of new techniques to improve data mining with the goal of discovering the most reliable users in a discussion subject, along with evaluation results. This algorithm regards a certain category of social network media called microblogs (e.g. Twitter), where parameters of the whole social network must be used because of the limitations of the size of text information in each message. The proposed algorithm brings into account metrics related to the frequency and the time zone of user activity and employs the Cluster-based Fusion technique to improve the quality of the answer. 2017-02-13T07:40:13Z 2017-02-13T07:40:13Z 2016-09-08 Thesis http://hdl.handle.net/10889/10107 gr 0 application/octet-stream application/pdf |