Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης

Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις τη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Τάτσης, Αλέξανδρος
Άλλοι συγγραφείς:	Tatsis, Alexandros
Γλώσσα:	Greek
Έκδοση:	2022
Θέματα:	Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python
Διαθέσιμο Online:	http://hdl.handle.net/10889/16343

id	nemertes-10889-16343
record_format	dspace
spelling	nemertes-10889-163432022-09-05T13:56:32Z Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης Detecting fake news of Covid-19 using machine learning techniques Τάτσης, Αλέξανδρος Tatsis, Alexandros Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python. The huge amount of information and news that produced by social media and the media, in general, has led science to find ways to moderate the problem of misinformation and malicious news, which aim to confuse the opinion of society. Assessing whether a piece of information or news is malicious presupposes a meticulous study of the subject. The need for process automation has led to develop methods and algorithms, which aim at processing text data, extracting information and categorizing them. In this paper we have collected a set of data from various articles and news referring to the pandemic COVID-19. The goal is to find a way to categorize our data into one of the two groups using machine leaning algorithms. We try to classify the news and see if they belong to the group of fake news or real news. In particular, the algorithms, we use, are Logistic Regression, Multinomial Naïve Bayes, LSTM model and BI-LSTM model. The Python’s sklearn and TensorFlow libraries are used to pre-process and apply algorithms. 2022-07-01T09:48:59Z 2022-07-01T09:48:59Z 2022-06-30 http://hdl.handle.net/10889/16343 gr application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python
spellingShingle	Επεξεργασία φυσικής γλώσσας Προεπεξεργασία κειμένου Εξόρυξη κειμένου Μηχανική μάθηση Βαθιά μηχανική μάθηση Λογιστική παλινδρόμηση Πολυωνυμικός αλγόριθμος Naïve Bayes Μακρύ βραχυπρόθεσμη μνήμη Αμφίδρομη βραχυπρόθεσμη μνήμη NLP Text preprocessing Text mining Machine learning Deep learning Logistic regression Multinomial Naïve Bayes LSTM BI-LSTM Python Τάτσης, Αλέξανδρος Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
description	Ο μεγάλος όγκος πληροφοριών και ειδήσεων που παράγονται από τα μέσα κοινωνικής δικτύωσης και από τα μέσα μαζικής ενημέρωσης έχει οδηγήσει την επιστήμη στην εύρεση μεθόδων ώστε να μετριάσουν το πρόβλημα της παραπληροφόρησης και των κακόβουλων ειδήσεων, που στόχο έχουν να διαστρεβλώνουν τις απόψεις της κοινωνίας. Η εκτίμηση για το αν μία πληροφορία ή είδηση είναι κακόβουλη προϋποθέτει σχολαστική μελέτη γύρω από το συγκεκριμένο θέμα. Η ανάγκη για αυτοματοποίηση της διαδικασίας οδήγησε στην ανάπτυξη μεθόδων και αλγορίθμων, που στόχο έχουν την επεξεργασία των δεδομένων κειμένων, την εξόρυξη πληροφοριών και την κατηγοριοποίησή τους. Στην παρούσα διπλωματική εργασία έχουμε συλλέξει δεδομένα από διάφορα άρθρα, που έχουν δημοσιευτεί στο διαδίκτυο, όπως επίσης και ειδήσεις από την πλατφόρμα του Twitter, που αναφέρονται στην πανδημία COVID-19. Με την χρήση αλγορίθμων μηχανικής μάθησης προσπαθούμε να κατηγοριοποιήσουμε τα δεδομένα μας σε μία από τις δύο ομάδες, δηλαδή προσπαθούμε να δούμε αν ανήκουν στην ομάδα των αληθών ειδήσεων ή στην ομάδα των ψευδών ειδήσεων. Ειδικότερα, χρησιμοποιούνται οι αλγόριθμοι της λογιστικής παλινδρόμησης, του πολυωνυμικού Naïve Bayes και δύο μοντέλων βαθιάς μηχανικής μάθησης (μοντέλο LSTM και μοντέλο BI-LSTM). Η προεπεξεργασία και η εφαρμογή των αλγορίθμων πραγματοποιήθηκε με την βοήθεια των βιβλιοθηκών sklearn και TensorFlow της Python.
author2	Tatsis, Alexandros
author_facet	Tatsis, Alexandros Τάτσης, Αλέξανδρος
author	Τάτσης, Αλέξανδρος
author_sort	Τάτσης, Αλέξανδρος
title	Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_short	Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_full	Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_fullStr	Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_full_unstemmed	Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
title_sort	ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης
publishDate	2022
url	http://hdl.handle.net/10889/16343
work_keys_str_mv	AT tatsēsalexandros anichneusēpseudōneidēseōnmechrēsētechnikōnmēchanikēsmathēsēs AT tatsēsalexandros detectingfakenewsofcovid19usingmachinelearningtechniques
_version_	1771297234993807360

Ανίχνευση ψευδών ειδήσεων με χρήση τεχνικών μηχανικής μάθησης

Παρόμοια τεκμήρια