Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης

Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη του...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Μισύρης, Ανδρέας
Άλλοι συγγραφείς: Misyris, Andreas
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25083
id nemertes-10889-25083
record_format dspace
spelling nemertes-10889-250832023-06-16T03:54:40Z Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης Sentiment analysis with data augmentation and machine learning methods Μισύρης, Ανδρέας Misyris, Andreas Ταξινόμηση κειμένων Ανάλυση συναισθήματος Επεξεργασία φυσικής γλώσσας Επεξεργασία κειμένων Επαύξηση δεδομένων Text classification Sentiment analysis Natural language processing Text preprocessing Data augmentation Latent semantic analysis Latent dirichlet allocation Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη τους όσο και στην εκμετάλλευση τους. Ένα τέτοιο ζήτημα καλείται να επιλύσει ο ταχεία ανελισσόμενος κλάδος της ταξινόμησης κειμένων. Πλέον ένα μοντέλο είναι σε θέση να γνωρίζει σε ένα δοσμένο κείμενο, το θέμα με το οποίο σχετίζεται, αρκεί το κείμενο να είναι αρκετά μεγάλο. Τι συμβαίνει όμως αν το κείμενο αποτελείται από μερικές προτάσεις, πόσο μάλλον από μερικές μόνο λέξεις; Τα μέσα μαζικής δικτύωσης είναι αναπόσπαστο κομμάτι της καθημερινότητας μας. Και τα μέσα είναι γεμάτα από κείμενα μικρού μήκους που είναι σε μερικές περιπτώσεις δύσκολο να ταξινομηθούν. Στον τομέα της ανάλυσης δεδομένων, υπάρχει η τεχνική της επαύξησης σε περίπτωση ελλείπων δεδομένων. Σκοπός αυτής της έρευνας είναι η επαύξηση τέτοιων κειμένων για την βελτίωση της ταξινόμησης τους. Χρησιμοποιήθηκαν τεχνικές μείωσης διαστάσεων (Latent Semantic Analysis), η εκπαίδευση ενός πακέτου (Word2Vec) καθώς και η εφαρμογή εύρεσης θεμάτων (Latent Dirichlet Allocation). Μετά την απόκτηση των επαυξημένων κειμένων, έγινε χρήση αλγορίθμων μηχανικής και βαθιάς μάθησης για την ταξινόμηση των κειμένων αυτών. Our daily lives are based on data that we handle to make decisions, either with or without the help of computers. A large part of this data is numerical, but over time, linguistic data has become increasingly valuable, both in its study and its exploitation. Such an issue is called upon to be solved by the rapidly evolving field of text classification. Nowadays a model can recognize the topic related to a given text, provided the text is long enough. But what happens if the text consists of a few sentences, let alone a few words? Social media is an integral part of our daily lives. And social media platforms are full of short texts that are sometimes difficult to classify. In the field of data analysis, there is a technique called data augmentation for cases of missing data. The purpose of this research is to augment such texts to improve their classification. Techniques such as Latent Semantic Analysis, training a package (Word2Vec) and the application of topic modeling (Latent Dirichlet Allocation) were used. After acquiring the augmented texts, machine learning and deep learning algorithms were used for their classification. 2023-06-15T07:40:00Z 2023-06-15T07:40:00Z 2023-05-30 https://hdl.handle.net/10889/25083 el CC0 1.0 Universal http://creativecommons.org/publicdomain/zero/1.0/ application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ταξινόμηση κειμένων
Ανάλυση συναισθήματος
Επεξεργασία φυσικής γλώσσας
Επεξεργασία κειμένων
Επαύξηση δεδομένων
Text classification
Sentiment analysis
Natural language processing
Text preprocessing
Data augmentation
Latent semantic analysis
Latent dirichlet allocation
spellingShingle Ταξινόμηση κειμένων
Ανάλυση συναισθήματος
Επεξεργασία φυσικής γλώσσας
Επεξεργασία κειμένων
Επαύξηση δεδομένων
Text classification
Sentiment analysis
Natural language processing
Text preprocessing
Data augmentation
Latent semantic analysis
Latent dirichlet allocation
Μισύρης, Ανδρέας
Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
description Η καθημερινότητα μας βασίζεται σε δεδομένα, τα οποία τα χειριζόμαστε οι ίδιοι για να πάρουμε αποφάσεις είτε με την βοήθεια υπολογιστών είτε όχι. Ένα μεγάλο μέρος αυτών των δεδομένων είναι αριθμητικό, όμως με την πάροδο των χρόνων, γλωσσικά δεδομένα γίνονται όλο και πιο πολύτιμα, τόσο στην μελέτη τους όσο και στην εκμετάλλευση τους. Ένα τέτοιο ζήτημα καλείται να επιλύσει ο ταχεία ανελισσόμενος κλάδος της ταξινόμησης κειμένων. Πλέον ένα μοντέλο είναι σε θέση να γνωρίζει σε ένα δοσμένο κείμενο, το θέμα με το οποίο σχετίζεται, αρκεί το κείμενο να είναι αρκετά μεγάλο. Τι συμβαίνει όμως αν το κείμενο αποτελείται από μερικές προτάσεις, πόσο μάλλον από μερικές μόνο λέξεις; Τα μέσα μαζικής δικτύωσης είναι αναπόσπαστο κομμάτι της καθημερινότητας μας. Και τα μέσα είναι γεμάτα από κείμενα μικρού μήκους που είναι σε μερικές περιπτώσεις δύσκολο να ταξινομηθούν. Στον τομέα της ανάλυσης δεδομένων, υπάρχει η τεχνική της επαύξησης σε περίπτωση ελλείπων δεδομένων. Σκοπός αυτής της έρευνας είναι η επαύξηση τέτοιων κειμένων για την βελτίωση της ταξινόμησης τους. Χρησιμοποιήθηκαν τεχνικές μείωσης διαστάσεων (Latent Semantic Analysis), η εκπαίδευση ενός πακέτου (Word2Vec) καθώς και η εφαρμογή εύρεσης θεμάτων (Latent Dirichlet Allocation). Μετά την απόκτηση των επαυξημένων κειμένων, έγινε χρήση αλγορίθμων μηχανικής και βαθιάς μάθησης για την ταξινόμηση των κειμένων αυτών.
author2 Misyris, Andreas
author_facet Misyris, Andreas
Μισύρης, Ανδρέας
author Μισύρης, Ανδρέας
author_sort Μισύρης, Ανδρέας
title Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
title_short Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
title_full Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
title_fullStr Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
title_full_unstemmed Ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
title_sort ανάλυση συναισθήματος με χρήση μεθόδων επαύξησης δεδομένων και μηχανικής μάθησης
publishDate 2023
url https://hdl.handle.net/10889/25083
work_keys_str_mv AT misyrēsandreas analysēsynaisthēmatosmechrēsēmethodōnepauxēsēsdedomenōnkaimēchanikēsmathēsēs
AT misyrēsandreas sentimentanalysiswithdataaugmentationandmachinelearningmethods
_version_ 1771297196866535424