Περίληψη: | H συνεχόμενη ανάπτυξη του διαδικτύου δημιούργησε νέους τρόπους επικοινωνίας. Τα social media παράγουν ένα τεράστιο όγκο δεδομένων σε μορφή κειμένου, τα οποία παρέχουν πληροφορίες για τις απόψεις και τα συναισθήματα των χρηστών. Σκοπός της Εξόρυξης Δεδομένων (Data Mining) και Ανάλυσης Συναισθήματος (Sentiment Analysis) είναι η επεξεργασία των πληροφοριών αυτών και η εξαγωγή συμπερασμάτων ως προς τα συναισθήματα των χρηστών και τη πολικότητα του κειμένου. Το οποίο είναι πολύ χρήσιμο κυρίως στην εξέλιξη και ανάπτυξη των εταιρειών. Η παρούσα διπλωματική εργασία μελετάει τις τεχνικές και τα εργαλεία της Ανάλυσης Συναισθήματος. Έπειτα, εξετάζονται οι κατηγορίες των τεχνικών Ανάλυσης Συναισθήματος, οι οποίες είναι οι τεχνικές με λεξικά, τεχνικές με επιβλεπόμενη και μη-επιβλεπόμενη μηχανική μάθηση. Στη συνέχεια γίνεται μελέτη και σύγκριση διαφορετικών μοντέλων κατηγοριοποίησης κειμένων από σελίδες κριτικής ταινιών (IMDb). Αλγόριθμοι που θα χρησιμοποιηθούν είναι ο Πολυωνυμικός «Αφελής» Bayes (Multinomial Naive Bayes) και οι Μηχανές Διανυσμάτων Υποστήριξης (SVM). Τα μοντέλα κατηγοριοποίησης υλοποιούνται μέσω του προγραμματιστικού περιβάλλοντος Weka.
|