Περίληψη: | Ο στόχος αυτής της διπλωματικής εργασίας είναι η ταξινόμηση μικρών μηνυμάτων από το Twitter με κριτήριο το συναίσθημα που εκπέμπουν και η σύγκριση του όγκου και της πολικότητάς τους με την αντίστοιχη κίνηση χρηματοοικονομικών μεγεθών με στόχο την πρόβλεψη. Η ποικιλομορφία των χαρακτήρων που χρησιμοποιούνται στα tweets καθώς και ο τρόπος χρήσης της αγγλικής γλώσσας (ειρωνία, «αργκώ»..) καθιστούν την ταξινόμηση των μηνυμάτων πολύπλοκη και δύσκολη διαδικασία.
Για την αποδοτική ταξινόμηση κειμένου με βάση το συναίσθημα χρησιμοποιήθηκαν διάφορα API, αλγόριθμοι, test sets, καθώς και ένα website που κάνει πιο φιλική και εύκολη την διαδικασία για ένα μέσο χρήστη. Οι αλγόριθμοι που χρησιμοποιήθηκαν εξετάστηκαν ως προς το ποσοστό επιτυχούς πρόβλεψης τους με στόχο να προσεγγίσουν την ανθρώπινη κρίση. Τελικός στόχος ήταν ο εντοπισμός του δημοσίου συναισθήματος όπως αυτό εξήχθη από τα tweets και η πιθανή συσχέτιση του με οικονομικά και χρηματιστηριακά μεγέθη.
|