Περίληψη: | Οι άνθρωποι χρησιμοποιούν το Διαδίκτυο σήμερα για να επικοινωνήσουν ελεύθερα τις ιδέες και τις απόψεις τους και να μοιραστούν τη ζωή τους με άλλα άτομα (π.χ. μέσα κοινωνικής δικτύωσης). Η ανωνυμία παίζει σημαντικό παράγοντα για το εύρος του τι μπορεί να μοιραστεί σε αυτές τις πλατφόρμες.
Ορισμένοι χρήστες κάνουν κακή χρήση αυτών των πλατφόρμων για να μοιράζονται προσβλητική και ρητορική μίσους που στοχεύει συγκεκριμένα άτομα ή κοινότητες. Επιθετικές λέξεις, καταχρηστική γλώσσα ή ρητορική μίσους χρησιμοποιούνται για να βλάψουν την ταυτότητα μιας ομάδας ή ενός ατόμου με τρόπο που θα μπορούσε να προωθήσει τη βία, με άλλα λόγια κλιμάκωση από ομιλία σε δράση.
Άλλοι χρήστες τείνουν να εκφράζουν ειρωνεία μέσω των κειμένων τους. Ένα κείμενο είναι ειρωνικό όταν το νόημα είναι διαφορετικό από αυτό που εκφράζεται στην επιφάνεια. Αυτό γίνεται συνήθως για να τραβήξει την προσοχή των αναγνωστών και να σκεφτεί τη δήλωση.
Επομένως, είναι ένας σημαντικός προσανατολισμός να δημιουργηθεί ένας τρόπος προστασίας για τους χρήστες για να αποφευχθεί η επίτευξη αυτών των επιθέσεων. Τέτοια εργασία θα μπορούσε να γίνει χειροκίνητα από τον άνθρωπο, αλλά η ποσότητα του περιεχομένου είναι πολύ μεγάλη καθιστώντας αυτή την εργασία χρονοβόρα. Επομένως, είναι καλή ιδέα να δημιουργήσουμε ένα ταξινομητή που να προσδιορίζει τη ρητορική μίσους και να ξεχωρίζει μεταξύ της αποδεκτής ομιλίας και όχι.
Επίσης, δημιουργoύμε ένα ταξινομητή που προσδιορίζει τον ειρωνικό λόγο και τραβάει τη διαχωριστική γραμμή μεταξύ του ειρωνικού ή όχι. Αυτό μπορεί να βοηθήσει σε εργασίες που πρέπει να γίνει διάκριση μεταξύ αληθούς και ψευδούς πρόθεσης, όπως η συναισθηματική ανάλυση (sentimental analysis).
Τα δύο προτεινόμενα μοντέλα χρησιμοποιούν μηχανισμό προσοχής (attention mechanism) πάνω από το BERT για να αποκτήσουν σχετική σημασία των λέξεων, ακολουθούμενα από Fully-Connected layers, και ένα τελικό επίπεδο ταξινόμησης(classification) για κάθε στόχο, η οποία προβλέπει την τάξη.
|