Περίληψη: | Με την έλευση των μέσων κοινωνικής δικτύωσης, υπάρχει πληθώρα δεδομένων, έτσι ώστε τα συστήματα ανάλυσης δεδομένων να μπορούν να σχεδιαστούν αξιόπιστα για την τελική παροχή πολύτιμων πληροφοριών για ένα δεδομένο προϊόν ή υπηρεσία. Οι πελάτες ενός ξενοδοχειακού καταλύματος μπορούν να εκφράσουν κριτικές για κάθε παρεχόμενη υπηρεσία διαμονής ή/και για το κατάλυμα συνολικά. Αυτές οι κριτικές είναι ιδιαίτερα ενδιαφέρουσες για την τουριστική βιομηχανία καθώς μπορούν να χρησιμοποιηθούν για να εξαχθούν απόψεις και πτυχές των πελατών, οι οποίες θα βοηθήσουν τους ξενοδόχους να βελτιώσουν τις παρεχόμενες υπηρεσίες τους. Σε αυτή τη διπλωματική, εμβαθύνουμε στη λεπτομέρεια του σχεδιασμού και της υλοποίησης ενός συστήματος που αρχικά χρησιμοποιεί μια ευρεία συλλογή τεχνικών προεπεξεργασίας κειμένου, από κλασικές προσεγγίσεις Επεξεργασίας Φυσικής Γλώσσας με TF-IDF μέχρι μοντέλα word embeddings. Αυτές οι προσεγγίσεις στη συνέχεια παρέχονται ως είσοδοι σε διαφόρους σύγχρονους ταξινομητές, μεταξύ των οποίων είναι τα LSTM νευρωνικά δίκτυα και οι Transformers. Επιπλέον, έχει πραγματοποιηθεί ανάλυση topic modeling χρησιμοποιώντας μια ημι-εποπτευόμενη παραλλαγή του αλγόριθμου Latent Dirichlet Allocation (LDA) και τα αποτελέσματα του προτεινόμενου συστήματος έχουν επικυρωθεί μέσα από μια σειρά πειραμάτων.
|