Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις τη...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/16343 |
id |
nemertes-10889-16343 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-163432022-09-05T13:56:32Z Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης Detecting fake news of Covid-19 using machine learning techniques Τάτσης, Αλέξανδρος Tatsis, Alexandros Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python. The huge amount of information and news that produced by social media and the media, in general, has led science to find ways to moderate the problem of misinformation and malicious news, which aim to confuse the opinion of society. Assessing whether a piece of information or news is malicious presupposes a meticulous study of the subject. The need for process automation has led to develop methods and algorithms, which aim at processing text data, extracting information and categorizing them. In this paper we have collected a set of data from various articles and news referring to the pandemic COVID-19. The goal is to find a way to categorize our data into one of the two groups using machine leaning algorithms. We try to classify the news and see if they belong to the group of fake news or real news. In particular, the algorithms, we use, are Logistic Regression, Multinomial Naïve Bayes, LSTM model and BI-LSTM model. The Python’s sklearn and TensorFlow libraries are used to pre-process and apply algorithms. 2022-07-01T09:48:59Z 2022-07-01T09:48:59Z 2022-06-30 http://hdl.handle.net/10889/16343 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python |
spellingShingle |
Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python Τάτσης, Αλέξανδρος Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
description |
Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python. |
author2 |
Tatsis, Alexandros |
author_facet |
Tatsis, Alexandros Τάτσης, Αλέξανδρος |
author |
Τάτσης, Αλέξανδρος |
author_sort |
Τάτσης, Αλέξανδρος |
title |
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
title_short |
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
title_full |
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
title_fullStr |
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
title_full_unstemmed |
Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
title_sort |
ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/16343 |
work_keys_str_mv |
AT tatsēsalexandros anichneusēpseudōneidēseōnmechrēsētechnikōnmēchanikēsmathēsēs AT tatsēsalexandros detectingfakenewsofcovid19usingmachinelearningtechniques |
_version_ |
1771297234993807360 |