Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης

Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις τη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τάτσης, Αλέξανδρος
Άλλοι συγγραφείς: Tatsis, Alexandros
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/16343
id nemertes-10889-16343
record_format dspace
spelling nemertes-10889-163432022-09-05T13:56:32Z Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης Detecting fake news of Covid-19 using machine learning techniques Τάτσης, Αλέξανδρος Tatsis, Alexandros Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python. The huge amount of information and news that produced by social media and the media, in general, has led science to find ways to moderate the problem of misinformation and malicious news, which aim to confuse the opinion of society. Assessing whether a piece of information or news is malicious presupposes a meticulous study of the subject. The need for process automation has led to develop methods and algorithms, which aim at processing text data, extracting information and categorizing them. In this paper we have collected a set of data from various articles and news referring to the pandemic COVID-19. The goal is to find a way to categorize our data into one of the two groups using machine leaning algorithms. We try to classify the news and see if they belong to the group of fake news or real news. In particular, the algorithms, we use, are Logistic Regression, Multinomial Naïve Bayes, LSTM model and BI-LSTM model. The Python’s sklearn and TensorFlow libraries are used to pre-process and apply algorithms. 2022-07-01T09:48:59Z 2022-07-01T09:48:59Z 2022-06-30 http://hdl.handle.net/10889/16343 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Επεξεργασία φυσικής γλώσσας
Προεπεξεργασία κειμένου
Εξόρυξη κειμένου
Μηχανική μάθηση
Βαθιά μηχανική μάθηση
Λογιστική παλινδρόμηση
Πολυωνυμικός αλγόριθμος Naïve Bayes
Μακρύ βραχυπρόθεσμη μνήμη
Αμφίδρομη βραχυπρόθεσμη μνήμη
NLP
Text preprocessing
Text mining
Machine learning
Deep learning
Logistic regression
Multinomial Naïve Bayes
LSTM
BI-LSTM
Python
spellingShingle Επεξεργασία φυσικής γλώσσας
Προεπεξεργασία κειμένου
Εξόρυξη κειμένου
Μηχανική μάθηση
Βαθιά μηχανική μάθηση
Λογιστική παλινδρόμηση
Πολυωνυμικός αλγόριθμος Naïve Bayes
Μακρύ βραχυπρόθεσμη μνήμη
Αμφίδρομη βραχυπρόθεσμη μνήμη
NLP
Text preprocessing
Text mining
Machine learning
Deep learning
Logistic regression
Multinomial Naïve Bayes
LSTM
BI-LSTM
Python
Τάτσης, Αλέξανδρος
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
description Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python.
author2 Tatsis, Alexandros
author_facet Tatsis, Alexandros
Τάτσης, Αλέξανδρος
author Τάτσης, Αλέξανδρος
author_sort Τάτσης, Αλέξανδρος
title Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_short Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_full Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_fullStr Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_full_unstemmed Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_sort ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
publishDate 2022
url http://hdl.handle.net/10889/16343
work_keys_str_mv AT tatsēsalexandros anichneusēpseudōneidēseōnmechrēsētechnikōnmēchanikēsmathēsēs
AT tatsēsalexandros detectingfakenewsofcovid19usingmachinelearningtechniques
_version_ 1771297234993807360