Ανίχνευση fake news με τεχνικές μηχανικής μάθησης

Η εξέλιξη της τεχνολογίας και του διαδικτύου αύξησε την ευκολία πρόσβασης σε πληροφορίες και στην διάδοση τους. Η εποχή της πληροφορίας, είναι πραγματικά εποχή της παραπληροφόρησης, με τα fake news να είναι σχεδόν μάστιγα και χωρίς κάποιο τρόπο για μαζικό έλεγχο και πρόληψη τους. Όπλα στην καταπολέμ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Πουρνάρας, Κωνσταντίνος
Άλλοι συγγραφείς: Pournaras, Konstantinos
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25372
Περιγραφή
Περίληψη:Η εξέλιξη της τεχνολογίας και του διαδικτύου αύξησε την ευκολία πρόσβασης σε πληροφορίες και στην διάδοση τους. Η εποχή της πληροφορίας, είναι πραγματικά εποχή της παραπληροφόρησης, με τα fake news να είναι σχεδόν μάστιγα και χωρίς κάποιο τρόπο για μαζικό έλεγχο και πρόληψη τους. Όπλα στην καταπολέμηση τους αποτελούν μια πτυχή της επιστήμης των υπολογιστών, η τεχνητή νοημοσύνη, που παρέχει πληθώρα επιλογών σε μοντέλα προς εκπαίδευση καθώς και η γλωσσολογία που βοηθά στην καλύτερη επεξεργασία των δεδομένων εισόδου στα παραπάνω μοντέλα και κατ’ επέκταση στην αύξηση των επιδόσεών τους. Η παρούσα εργασία αποτελεί μια προσπάθεια δημιουργίας ενός μοντέλου με την καλύτερη δυνατή απόδοση που θα μπορεί να διαχωρίζει τις ψευδείς από τις αληθινές ειδήσεις. Αρχικά γίνεται λόγος στην ορολογία των fake news καθώς και στην επεξεργασία φυσικής γλώσσας. Στη συνέχεια παρουσιάζονται κάποια θεμελιώδη μοντέλα μηχανικής μάθησης, μαζί με 3 μεθόδους χρήσης πολλαπλών μοντέλων. Έπειτα γίνεται αναφορά στα δεδομένα, αναφορικά με την μορφή τους, την διαδικασία προ-επεξεργασίας και αποθήκευσής τους. Πριν γίνει είσοδος στα μοντέλα, επειδή αυτά δεν μπορούν να δεχτούν κείμενο, αλλά αριθμούς, γίνεται διανυσματοποίηση τους με 3 διαφορετικούς τρόπους. Οι 6 ταξινομητές που χρησιμοποιούνται, πριν συνδυαστούν, περνούν από εξοντωτική αναζήτηση με σκοπό την εύρεση των κατάλληλων υπερπαραμέτρων για την επίτευξη βέλτιστης απόδοσης σε κάθε εκδοχή διανυσματοποίησης. Τελικά, παράγονται 3 συνδυασμένα μοντέλα τα οποία καλούνται να προβλέψουν σε ένα εντελώς διαφορετικό σετ δεδομένων και μέσα από την ερμηνεία πολλών μετρικών, γίνεται η επιλογή του πιο ακριβούς. Δίπλα στο πιο ακριβές μοντέλο παρατίθεται ένα έτοιμο νευρωνικό δίκτυο που χρησιμοποιεί διαφορετική προσέγγιση και γίνεται σύγκριση της ακρίβειας και των χρόνων εκπαίδευσης. Κύριος σκοπός είναι, με τoν συνδυασμό ήδη υπαρχόντων μοντέλων, την σωστή προ-επεξεργασία των δεδομένων εισόδου και την επιλογή κατάλληλης μεθόδου διανυσματοποίησης, η επίτευξη υψηλής ακρίβειας πρόβλεψης. Τα αποτελέσματα της έρευνας δείχνουν ότι με την κατάλληλη μεθοδολογία, ένα μοντέλο μηχανικής μάθησης μπορεί να πετύχει πολύ καλές επιδόσεις, κάποιες φορές καλύτερες και από «προχωρημένες» ή περίπλοκες τεχνικές, με χαμηλότερο κόστος σε χρόνο και πόρους.