Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης

Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Λιάπης, Χαράλαμπος
Άλλοι συγγραφείς: Liapis, Charalampos
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13558
id nemertes-10889-13558
record_format dspace
spelling nemertes-10889-135582022-09-05T05:38:37Z Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης Automatic text summarization using machine learning Λιάπης, Χαράλαμπος Liapis, Charalampos Επεξεργασία φυσικής γλώσσας Αυτόματη σύνοψη Διανυσματικές αναπαραστάσεις Νευρωνικά δίκτυα Natural language processing Automatic summarization Vector representations Neural networks Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας από τη μηχανή, η αυτόματη σύνοψη κειμένου μπορεί να ορισθεί ως ένα παραχθέν από κάποιο λογισμικό κείμενο το οποίο, όντας συνεκτικό ως προς τη δομή και τη συνάφεια, περιέχει ένα σημαντικό ποσό πληροφοριακού περιεχομένου από το αρχικό. Στην παρούσα εργασία θα διερευνηθούν, καταρχάς, τρόποι παράστασης της σημασιολογίας των λέξεων, φράσεων και προτάσεων που εμφανίζονται σε ένα δοθέν corpus, καθώς επίσης και των σημασιολογικών συσχετισμών που προκύπτουν μεταξύ αυτών, με τη χρήση ρηχών νευρωνικών δικτύων σύμφωνα με τη λογική της διανυσματικής αναπαράστασης. ΄Επειτα, ξεκινώντας από ένα δεδομένο κάθε φορά προς σύνοψη κείμενο και χρησιμοποιώντας εκ νέου αλγορίθμους μηχανικής μάθησης, θα εξαχθούν σύμφωνα με τις ήδη διαμορφωθείσες διανυσματικές αφαιρέσεις, οι οποίες θα έχουν τη μορφή προτασιακών διανυσμάτων, οι απαραίτητες πληροφορίες για την, αρχικά, ομαδοποίηση αυτών ως προς τη σημασιολογία και ακολούθως την εξαγωγή, διατήρηση και παράφραση των κυριοτέρων σημείων του κειμένου, προκειμένου η ζητούμενη σύνοψη, ιδανικά, καταρχάς να επιτυγχάνει ως προς την συνοχή και ακολούθως να μην υπολείπεται ουσιωδώς του κειμένου ως προς το πληροφοριακό περιεχόμενο. A synopsis is a short, precise representation of the content of a document. At its best, it summarizes the basic content of the document while also indicating the structure, functioning somewhat as a substitute for it. Given the difficulty of such a process being performed by the machine, automatic text summary can be defined as a software-generated text which, being consistent in structure and relevance, contains a significant amount of informational content from the original. In this paper, we will first explore ways of representing the semantics of words, phrases and sentences appearing in a given corpus, as well as the semantic correlations that emerge between them, using shallow neural networks according to the concept of vector representation. Then, each time starting from a given query text to be summarized and using once more machine learning algorithms, we will export, in accordance with the vector abstractions already formulated as sentence vectors, the information necessary to initially group them in terms of semantics and then to extract, maintain and paraphrase the key points of the text so that the produced summary, ideally, achieves coherence and does not substantially lag regarding the information content. 2020-07-12T14:23:56Z 2020-07-12T14:23:56Z 2020-05-11 http://hdl.handle.net/10889/13558 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Επεξεργασία φυσικής γλώσσας
Αυτόματη σύνοψη
Διανυσματικές αναπαραστάσεις
Νευρωνικά δίκτυα
Natural language processing
Automatic summarization
Vector representations
Neural networks
spellingShingle Επεξεργασία φυσικής γλώσσας
Αυτόματη σύνοψη
Διανυσματικές αναπαραστάσεις
Νευρωνικά δίκτυα
Natural language processing
Automatic summarization
Vector representations
Neural networks
Λιάπης, Χαράλαμπος
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
description Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας από τη μηχανή, η αυτόματη σύνοψη κειμένου μπορεί να ορισθεί ως ένα παραχθέν από κάποιο λογισμικό κείμενο το οποίο, όντας συνεκτικό ως προς τη δομή και τη συνάφεια, περιέχει ένα σημαντικό ποσό πληροφοριακού περιεχομένου από το αρχικό. Στην παρούσα εργασία θα διερευνηθούν, καταρχάς, τρόποι παράστασης της σημασιολογίας των λέξεων, φράσεων και προτάσεων που εμφανίζονται σε ένα δοθέν corpus, καθώς επίσης και των σημασιολογικών συσχετισμών που προκύπτουν μεταξύ αυτών, με τη χρήση ρηχών νευρωνικών δικτύων σύμφωνα με τη λογική της διανυσματικής αναπαράστασης. ΄Επειτα, ξεκινώντας από ένα δεδομένο κάθε φορά προς σύνοψη κείμενο και χρησιμοποιώντας εκ νέου αλγορίθμους μηχανικής μάθησης, θα εξαχθούν σύμφωνα με τις ήδη διαμορφωθείσες διανυσματικές αφαιρέσεις, οι οποίες θα έχουν τη μορφή προτασιακών διανυσμάτων, οι απαραίτητες πληροφορίες για την, αρχικά, ομαδοποίηση αυτών ως προς τη σημασιολογία και ακολούθως την εξαγωγή, διατήρηση και παράφραση των κυριοτέρων σημείων του κειμένου, προκειμένου η ζητούμενη σύνοψη, ιδανικά, καταρχάς να επιτυγχάνει ως προς την συνοχή και ακολούθως να μην υπολείπεται ουσιωδώς του κειμένου ως προς το πληροφοριακό περιεχόμενο.
author2 Liapis, Charalampos
author_facet Liapis, Charalampos
Λιάπης, Χαράλαμπος
author Λιάπης, Χαράλαμπος
author_sort Λιάπης, Χαράλαμπος
title Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
title_short Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
title_full Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
title_fullStr Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
title_full_unstemmed Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
title_sort αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
publishDate 2020
url http://hdl.handle.net/10889/13558
work_keys_str_mv AT liapēscharalampos automatēsynopsēkeimenōnmechrēsēmēchanikēsmathēsēs
AT liapēscharalampos automatictextsummarizationusingmachinelearning
_version_ 1771297144020402176