Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης

Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τζελέπης, Γεώργιος
Άλλοι συγγραφείς: Tzelepis, Georgios
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15487
id nemertes-10889-15487
record_format dspace
spelling nemertes-10889-154872022-09-05T14:01:22Z Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης Spam users detection on social networks with machine learning techniques Τζελέπης, Γεώργιος Tzelepis, Georgios Μέσα κοινωνικής δικτύωσης Μηχανική μάθηση Ταξινόμηση Social networks Machine learning Classification Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύτερα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, το 1 στα 200 μηνύματα και η 1 στις 20 δημοσιεύσεις αντίστοιχα, έχουν κακόβουλο σκοπό. Οι κακόβουλοι αυτοί χρήστες αναφέρονται πιο συγκεκριμένα ως spammers και οι αναρτήσεις (ή τα μηνύματά) τους ως spams. Έτσι, προκύπτει η ανάγκη για εντοπισμό του κακόβουλου περιεχομένου μέσω της συγκέντρωσης και της ανάλυσης μεγάλου όγκου δεδομένων. Στόχος της διπλωματικής είναι να εντοπίσει spam περιεχόμενο στις δημοσιεύσεις των χρηστών του Twitter με μη χειροκίνητο τρόπο. Αρχικά, γίνεται η συλλογή των δεδομένων και η εξαγωγή κάποιων χαρακτηριστικών από αυτά. Η επιλογή συγκεκριμένων χαρακτηριστικών γίνεται λόγω του μεγάλου όγκου χαρακτηριστικών των δεδομένων. Στη συνέχεια ακολουθεί η προσπάθεια ταξινόμησης των δημοσιεύσεων (σε κακόβουλες ή μη-κακόβουλες) η οποία βασίζεται σε αλγορίθμους μηχανικής μάθησης. Για την υλοποίηση όλων των προηγουμένων χρησιμοποιήθηκαν γνωστές βιβλιοθήκες και εργαλεία. Social media allows users to process and learn information they want very quickly. But this allows malicious to act and disorient other users through posts or messages. It is reported that on major social media, such as Facebook and Twitter, 1 in 200 messages and 1 in 20 posts respectively, have malicious intent. These malicious users are more specifically referred to as spammers and their posts (or messages) as spams. Thus, the need arises to detect malicious content through the collection and analysis of large volumes of data. The goal of this thesis is to detect spam content in Twitter users' posts in a non-automated way. First, the data is collected and some features are extracted from it. The selection of specific features is due to the large volume of features of the data. Then follows the attempt to classify posts (as spams or non-spams) based on machine learning algorithms. Popular libraries and tools were used to implement the above. 2021-11-02T06:50:37Z 2021-11-02T06:50:37Z 2021-09-23 http://hdl.handle.net/10889/15487 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μέσα κοινωνικής δικτύωσης
Μηχανική μάθηση
Ταξινόμηση
Social networks
Machine learning
Classification
spellingShingle Μέσα κοινωνικής δικτύωσης
Μηχανική μάθηση
Ταξινόμηση
Social networks
Machine learning
Classification
Τζελέπης, Γεώργιος
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
description Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύτερα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, το 1 στα 200 μηνύματα και η 1 στις 20 δημοσιεύσεις αντίστοιχα, έχουν κακόβουλο σκοπό. Οι κακόβουλοι αυτοί χρήστες αναφέρονται πιο συγκεκριμένα ως spammers και οι αναρτήσεις (ή τα μηνύματά) τους ως spams. Έτσι, προκύπτει η ανάγκη για εντοπισμό του κακόβουλου περιεχομένου μέσω της συγκέντρωσης και της ανάλυσης μεγάλου όγκου δεδομένων. Στόχος της διπλωματικής είναι να εντοπίσει spam περιεχόμενο στις δημοσιεύσεις των χρηστών του Twitter με μη χειροκίνητο τρόπο. Αρχικά, γίνεται η συλλογή των δεδομένων και η εξαγωγή κάποιων χαρακτηριστικών από αυτά. Η επιλογή συγκεκριμένων χαρακτηριστικών γίνεται λόγω του μεγάλου όγκου χαρακτηριστικών των δεδομένων. Στη συνέχεια ακολουθεί η προσπάθεια ταξινόμησης των δημοσιεύσεων (σε κακόβουλες ή μη-κακόβουλες) η οποία βασίζεται σε αλγορίθμους μηχανικής μάθησης. Για την υλοποίηση όλων των προηγουμένων χρησιμοποιήθηκαν γνωστές βιβλιοθήκες και εργαλεία.
author2 Tzelepis, Georgios
author_facet Tzelepis, Georgios
Τζελέπης, Γεώργιος
author Τζελέπης, Γεώργιος
author_sort Τζελέπης, Γεώργιος
title Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
title_short Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
title_full Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
title_fullStr Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
title_full_unstemmed Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
title_sort εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
publishDate 2021
url http://hdl.handle.net/10889/15487
work_keys_str_mv AT tzelepēsgeōrgios entopismoskakoboulōnchrēstōnstakoinōnikadiktyametechnikesmēchanikēsmathēsēs
AT tzelepēsgeōrgios spamusersdetectiononsocialnetworkswithmachinelearningtechniques
_version_ 1771297213816766464