Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης
Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13558 |
id |
nemertes-10889-13558 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-135582022-09-05T05:38:37Z Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης Automatic text summarization using machine learning Λιάπης, Χαράλαμπος Liapis, Charalampos Επεξεργασία φυσικής γλώσσας Αυτόματη σύνοψη Διανυσματικές αναπαραστάσεις Νευρωνικά δίκτυα Natural language processing Automatic summarization Vector representations Neural networks Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας από τη μηχανή, η αυτόματη σύνοψη κειμένου μπορεί να ορισθεί ως ένα παραχθέν από κάποιο λογισμικό κείμενο το οποίο, όντας συνεκτικό ως προς τη δομή και τη συνάφεια, περιέχει ένα σημαντικό ποσό πληροφοριακού περιεχομένου από το αρχικό. Στην παρούσα εργασία θα διερευνηθούν, καταρχάς, τρόποι παράστασης της σημασιολογίας των λέξεων, φράσεων και προτάσεων που εμφανίζονται σε ένα δοθέν corpus, καθώς επίσης και των σημασιολογικών συσχετισμών που προκύπτουν μεταξύ αυτών, με τη χρήση ρηχών νευρωνικών δικτύων σύμφωνα με τη λογική της διανυσματικής αναπαράστασης. ΄Επειτα, ξεκινώντας από ένα δεδομένο κάθε φορά προς σύνοψη κείμενο και χρησιμοποιώντας εκ νέου αλγορίθμους μηχανικής μάθησης, θα εξαχθούν σύμφωνα με τις ήδη διαμορφωθείσες διανυσματικές αφαιρέσεις, οι οποίες θα έχουν τη μορφή προτασιακών διανυσμάτων, οι απαραίτητες πληροφορίες για την, αρχικά, ομαδοποίηση αυτών ως προς τη σημασιολογία και ακολούθως την εξαγωγή, διατήρηση και παράφραση των κυριοτέρων σημείων του κειμένου, προκειμένου η ζητούμενη σύνοψη, ιδανικά, καταρχάς να επιτυγχάνει ως προς την συνοχή και ακολούθως να μην υπολείπεται ουσιωδώς του κειμένου ως προς το πληροφοριακό περιεχόμενο. A synopsis is a short, precise representation of the content of a document. At its best, it summarizes the basic content of the document while also indicating the structure, functioning somewhat as a substitute for it. Given the difficulty of such a process being performed by the machine, automatic text summary can be defined as a software-generated text which, being consistent in structure and relevance, contains a significant amount of informational content from the original. In this paper, we will first explore ways of representing the semantics of words, phrases and sentences appearing in a given corpus, as well as the semantic correlations that emerge between them, using shallow neural networks according to the concept of vector representation. Then, each time starting from a given query text to be summarized and using once more machine learning algorithms, we will export, in accordance with the vector abstractions already formulated as sentence vectors, the information necessary to initially group them in terms of semantics and then to extract, maintain and paraphrase the key points of the text so that the produced summary, ideally, achieves coherence and does not substantially lag regarding the information content. 2020-07-12T14:23:56Z 2020-07-12T14:23:56Z 2020-05-11 http://hdl.handle.net/10889/13558 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Επεξεργασία φυσικής γλώσσας Αυτόματη σύνοψη Διανυσματικές αναπαραστάσεις Νευρωνικά δίκτυα Natural language processing Automatic summarization Vector representations Neural networks |
spellingShingle |
Επεξεργασία φυσικής γλώσσας Αυτόματη σύνοψη Διανυσματικές αναπαραστάσεις Νευρωνικά δίκτυα Natural language processing Automatic summarization Vector representations Neural networks Λιάπης, Χαράλαμπος Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
description |
Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας από τη μηχανή, η αυτόματη σύνοψη κειμένου μπορεί να ορισθεί ως ένα παραχθέν από κάποιο λογισμικό κείμενο το οποίο, όντας συνεκτικό ως προς τη δομή και τη συνάφεια, περιέχει ένα σημαντικό ποσό πληροφοριακού περιεχομένου από το αρχικό. Στην παρούσα εργασία θα διερευνηθούν, καταρχάς, τρόποι παράστασης της σημασιολογίας των λέξεων, φράσεων και προτάσεων που εμφανίζονται σε ένα δοθέν corpus, καθώς επίσης και των σημασιολογικών συσχετισμών που προκύπτουν μεταξύ αυτών, με τη χρήση ρηχών νευρωνικών δικτύων σύμφωνα με τη λογική της διανυσματικής αναπαράστασης. ΄Επειτα, ξεκινώντας από ένα δεδομένο κάθε φορά προς σύνοψη κείμενο και χρησιμοποιώντας εκ νέου αλγορίθμους μηχανικής μάθησης, θα εξαχθούν σύμφωνα με τις ήδη διαμορφωθείσες διανυσματικές αφαιρέσεις, οι οποίες θα έχουν τη μορφή προτασιακών διανυσμάτων, οι απαραίτητες πληροφορίες για την, αρχικά, ομαδοποίηση αυτών ως προς τη σημασιολογία και ακολούθως την εξαγωγή, διατήρηση και παράφραση των κυριοτέρων σημείων του κειμένου, προκειμένου η ζητούμενη σύνοψη, ιδανικά, καταρχάς να επιτυγχάνει ως προς την συνοχή και ακολούθως να μην υπολείπεται ουσιωδώς του κειμένου ως προς το πληροφοριακό περιεχόμενο. |
author2 |
Liapis, Charalampos |
author_facet |
Liapis, Charalampos Λιάπης, Χαράλαμπος |
author |
Λιάπης, Χαράλαμπος |
author_sort |
Λιάπης, Χαράλαμπος |
title |
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
title_short |
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
title_full |
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
title_fullStr |
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
title_full_unstemmed |
Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
title_sort |
αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13558 |
work_keys_str_mv |
AT liapēscharalampos automatēsynopsēkeimenōnmechrēsēmēchanikēsmathēsēs AT liapēscharalampos automatictextsummarizationusingmachinelearning |
_version_ |
1771297144020402176 |