Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη του...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/25083 |
id |
nemertes-10889-25083 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-250832023-06-16T03:54:40Z Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης Sentiment analysis with data augmentation and machine learning methods Μισύρης, Ανδρέας Misyris, Andreas Ταξινόμηση κειμένων Ανάλυση συναισθήματος Επεξεργασία φυσικής γλώσσας Επεξεργασία κειμένων Επαύξηση δεδομένων Text classification Sentiment analysis Natural language processing Text preprocessing Data augmentation Latent semantic analysis Latent dirichlet allocation Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη τους όσο και στην εκμετάλλευση τους. Ένα τέτοιο ζήτημα καλείται να επιλύσει ο ταχεία ανελισσόμενος κλάδος της ταξινόμησης κειμένων. Πλέον ένα μοντέλο είναι σε θέση να γνωρίζει σε ένα δοσμένο κείμενο, το θέμα με το οποίο σχετίζεται, αρκεί το κείμενο να είναι αρκετά μεγάλο. Τι συμβαίνει όμως αν το κείμενο αποτελείται από μερικές προτάσεις, πόσο μάλλον από μερικές μόνο λέξεις; Τα μέσα μαζικής δικτύωσης είναι αναπόσπαστο κομμάτι της καθημερινότητας μας. Και τα μέσα είναι γεμάτα από κείμενα μικρού μήκους που είναι σε μερικές περιπτώσεις δύσκολο να ταξινομηθούν. Στον τομέα της ανάλυσης δεδομένων, υπάρχει η τεχνική της επαύξησης σε περίπτωση ελλείπων δεδομένων. Σκοπός αυτής της έρευνας είναι η επαύξηση τέτοιων κειμένων για την βελτίωση της ταξινόμησης τους. Χρησιμοποιήθηκαν τεχνικές μείωσης διαστάσεων (Latent Semantic Analysis), η εκπαίδευση ενός πακέτου (Word2Vec) καθώς και η εφαρμογή εύρεσης θεμάτων (Latent Dirichlet Allocation). Μετά την απόκτηση των επαυξημένων κειμένων, έγινε χρήση αλγορίθμων μηχανικής και βαθιάς μάθησης για την ταξινόμηση των κειμένων αυτών. Our daily lives are based on data that we handle to make decisions, either with or without the help of computers. A large part of this data is numerical, but over time, linguistic data has become increasingly valuable, both in its study and its exploitation. Such an issue is called upon to be solved by the rapidly evolving field of text classification. Nowadays a model can recognize the topic related to a given text, provided the text is long enough. But what happens if the text consists of a few sentences, let alone a few words? Social media is an integral part of our daily lives. And social media platforms are full of short texts that are sometimes difficult to classify. In the field of data analysis, there is a technique called data augmentation for cases of missing data. The purpose of this research is to augment such texts to improve their classification. Techniques such as Latent Semantic Analysis, training a package (Word2Vec) and the application of topic modeling (Latent Dirichlet Allocation) were used. After acquiring the augmented texts, machine learning and deep learning algorithms were used for their classification. 2023-06-15T07:40:00Z 2023-06-15T07:40:00Z 2023-05-30 https://hdl.handle.net/10889/25083 el CC0 1.0 Universal http://creativecommons.org/publicdomain/zero/1.0/ application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ταξινόμηση κειμένων Ανάλυση συναισθήματος Επεξεργασία φυσικής γλώσσας Επεξεργασία κειμένων Επαύξηση δεδομένων Text classification Sentiment analysis Natural language processing Text preprocessing Data augmentation Latent semantic analysis Latent dirichlet allocation |
spellingShingle |
Ταξινόμηση κειμένων Ανάλυση συναισθήματος Επεξεργασία φυσικής γλώσσας Επεξεργασία κειμένων Επαύξηση δεδομένων Text classification Sentiment analysis Natural language processing Text preprocessing Data augmentation Latent semantic analysis Latent dirichlet allocation Μισύρης, Ανδρέας Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
description |
Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη τους όσο και στην εκμετάλλευση τους. Ένα τέτοιο ζήτημα καλείται να επιλύσει ο ταχεία ανελισσόμενος κλάδος της ταξινόμησης κειμένων. Πλέον ένα μοντέλο είναι σε θέση να γνωρίζει σε ένα δοσμένο κείμενο, το θέμα με το οποίο σχετίζεται, αρκεί το κείμενο να είναι αρκετά μεγάλο. Τι συμβαίνει όμως αν το κείμενο αποτελείται από μερικές προτάσεις, πόσο μάλλον από μερικές μόνο λέξεις;
Τα μέσα μαζικής δικτύωσης είναι αναπόσπαστο κομμάτι της καθημερινότητας μας. Και τα μέσα είναι γεμάτα από κείμενα μικρού μήκους που είναι σε μερικές περιπτώσεις δύσκολο να ταξινομηθούν. Στον τομέα της ανάλυσης δεδομένων, υπάρχει η τεχνική της επαύξησης σε περίπτωση ελλείπων δεδομένων. Σκοπός αυτής της έρευνας είναι η επαύξηση τέτοιων κειμένων για την βελτίωση της ταξινόμησης τους. Χρησιμοποιήθηκαν τεχνικές μείωσης διαστάσεων (Latent Semantic Analysis), η εκπαίδευση ενός πακέτου (Word2Vec) καθώς και η εφαρμογή εύρεσης θεμάτων (Latent Dirichlet Allocation). Μετά την απόκτηση των επαυξημένων κειμένων, έγινε χρήση αλγορίθμων μηχανικής και βαθιάς μάθησης για την ταξινόμηση των κειμένων αυτών. |
author2 |
Misyris, Andreas |
author_facet |
Misyris, Andreas Μισύρης, Ανδρέας |
author |
Μισύρης, Ανδρέας |
author_sort |
Μισύρης, Ανδρέας |
title |
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
title_short |
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
title_full |
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
title_fullStr |
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
title_full_unstemmed |
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
title_sort |
ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/25083 |
work_keys_str_mv |
AT misyrēsandreas analysēsynaisthēmatosmechrēsēmethodōnepauxēsēsdedomenōnkaimēchanikēsmathēsēs AT misyrēsandreas sentimentanalysiswithdataaugmentationandmachinelearningmethods |
_version_ |
1771297196866535424 |