Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης
Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15487 |
id |
nemertes-10889-15487 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-154872022-09-05T14:01:22Z Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης Spam users detection on social networks with machine learning techniques Τζελέπης, Γεώργιος Tzelepis, Georgios Μέσα κοινωνικής δικτύωσης Μηχανική μάθηση Ταξινόμηση Social networks Machine learning Classification Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύτερα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, το 1 στα 200 μηνύματα και η 1 στις 20 δημοσιεύσεις αντίστοιχα, έχουν κακόβουλο σκοπό. Οι κακόβουλοι αυτοί χρήστες αναφέρονται πιο συγκεκριμένα ως spammers και οι αναρτήσεις (ή τα μηνύματά) τους ως spams. Έτσι, προκύπτει η ανάγκη για εντοπισμό του κακόβουλου περιεχομένου μέσω της συγκέντρωσης και της ανάλυσης μεγάλου όγκου δεδομένων. Στόχος της διπλωματικής είναι να εντοπίσει spam περιεχόμενο στις δημοσιεύσεις των χρηστών του Twitter με μη χειροκίνητο τρόπο. Αρχικά, γίνεται η συλλογή των δεδομένων και η εξαγωγή κάποιων χαρακτηριστικών από αυτά. Η επιλογή συγκεκριμένων χαρακτηριστικών γίνεται λόγω του μεγάλου όγκου χαρακτηριστικών των δεδομένων. Στη συνέχεια ακολουθεί η προσπάθεια ταξινόμησης των δημοσιεύσεων (σε κακόβουλες ή μη-κακόβουλες) η οποία βασίζεται σε αλγορίθμους μηχανικής μάθησης. Για την υλοποίηση όλων των προηγουμένων χρησιμοποιήθηκαν γνωστές βιβλιοθήκες και εργαλεία. Social media allows users to process and learn information they want very quickly. But this allows malicious to act and disorient other users through posts or messages. It is reported that on major social media, such as Facebook and Twitter, 1 in 200 messages and 1 in 20 posts respectively, have malicious intent. These malicious users are more specifically referred to as spammers and their posts (or messages) as spams. Thus, the need arises to detect malicious content through the collection and analysis of large volumes of data. The goal of this thesis is to detect spam content in Twitter users' posts in a non-automated way. First, the data is collected and some features are extracted from it. The selection of specific features is due to the large volume of features of the data. Then follows the attempt to classify posts (as spams or non-spams) based on machine learning algorithms. Popular libraries and tools were used to implement the above. 2021-11-02T06:50:37Z 2021-11-02T06:50:37Z 2021-09-23 http://hdl.handle.net/10889/15487 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μέσα κοινωνικής δικτύωσης Μηχανική μάθηση Ταξινόμηση Social networks Machine learning Classification |
spellingShingle |
Μέσα κοινωνικής δικτύωσης Μηχανική μάθηση Ταξινόμηση Social networks Machine learning Classification Τζελέπης, Γεώργιος Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
description |
Τα μέσα κοινωνικής δικτύωσης επιτρέπουν στους χρήστες να επεξεργάζονται και να μαθαίνουν πολύ γρήγορα επιθυμητές γι' αυτούς πληροφορίες. Αυτό όμως δίνει τη δυνατότητα σε κακόβουλους να δρούν και να αποπροσανατολίζουν τους υπόλοιπους χρήστες μέσω αναρτήσεων ή μηνυμάτων. Αναφέρεται ότι στα μεγαλύτερα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, το 1 στα 200 μηνύματα και η 1 στις 20 δημοσιεύσεις αντίστοιχα, έχουν κακόβουλο σκοπό. Οι κακόβουλοι αυτοί χρήστες αναφέρονται πιο συγκεκριμένα ως spammers και οι αναρτήσεις (ή τα μηνύματά) τους ως spams. Έτσι, προκύπτει η ανάγκη για εντοπισμό του κακόβουλου περιεχομένου μέσω της συγκέντρωσης και της ανάλυσης μεγάλου όγκου δεδομένων. Στόχος της διπλωματικής είναι να εντοπίσει spam περιεχόμενο στις δημοσιεύσεις των χρηστών του Twitter με μη χειροκίνητο τρόπο. Αρχικά, γίνεται η συλλογή των δεδομένων και η εξαγωγή κάποιων χαρακτηριστικών από αυτά. Η επιλογή συγκεκριμένων χαρακτηριστικών γίνεται λόγω του μεγάλου όγκου χαρακτηριστικών των δεδομένων. Στη συνέχεια ακολουθεί η προσπάθεια ταξινόμησης των δημοσιεύσεων (σε κακόβουλες ή μη-κακόβουλες) η οποία βασίζεται σε αλγορίθμους μηχανικής μάθησης. Για την υλοποίηση όλων των προηγουμένων χρησιμοποιήθηκαν γνωστές βιβλιοθήκες και εργαλεία. |
author2 |
Tzelepis, Georgios |
author_facet |
Tzelepis, Georgios Τζελέπης, Γεώργιος |
author |
Τζελέπης, Γεώργιος |
author_sort |
Τζελέπης, Γεώργιος |
title |
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
title_short |
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
title_full |
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
title_fullStr |
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
title_full_unstemmed |
Εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
title_sort |
εντοπισμός κακόβουλων χρηστών στα κοινωνικά δίκτυα με τεχνικές μηχανικής μάθησης |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/15487 |
work_keys_str_mv |
AT tzelepēsgeōrgios entopismoskakoboulōnchrēstōnstakoinōnikadiktyametechnikesmēchanikēsmathēsēs AT tzelepēsgeōrgios spamusersdetectiononsocialnetworkswithmachinelearningtechniques |
_version_ |
1771297213816766464 |