Αυτόματη σύνοψη κειμένων με χρήση μηχανικής μάθησης

Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Λιάπης, Χαράλαμπος
Άλλοι συγγραφείς: Liapis, Charalampos
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13558
Περιγραφή
Περίληψη:Περίληψη είναι μια συντομευμένη, ακριβής αναπαράσταση του περιεχομένου ενός εγγράφου. Στην οριακά θετική της αναφορά, συνοψίζει το βασικό του περιεχόμενο υποδεικνύοντας ταυτοχρόνως και τη δομή, λειτουργώντας τρόπον τινά ως υποκατάστατό του. Δεδομένης της δυσκολίας υλοποίησης μιας τέτοιας διαδικασίας από τη μηχανή, η αυτόματη σύνοψη κειμένου μπορεί να ορισθεί ως ένα παραχθέν από κάποιο λογισμικό κείμενο το οποίο, όντας συνεκτικό ως προς τη δομή και τη συνάφεια, περιέχει ένα σημαντικό ποσό πληροφοριακού περιεχομένου από το αρχικό. Στην παρούσα εργασία θα διερευνηθούν, καταρχάς, τρόποι παράστασης της σημασιολογίας των λέξεων, φράσεων και προτάσεων που εμφανίζονται σε ένα δοθέν corpus, καθώς επίσης και των σημασιολογικών συσχετισμών που προκύπτουν μεταξύ αυτών, με τη χρήση ρηχών νευρωνικών δικτύων σύμφωνα με τη λογική της διανυσματικής αναπαράστασης. ΄Επειτα, ξεκινώντας από ένα δεδομένο κάθε φορά προς σύνοψη κείμενο και χρησιμοποιώντας εκ νέου αλγορίθμους μηχανικής μάθησης, θα εξαχθούν σύμφωνα με τις ήδη διαμορφωθείσες διανυσματικές αφαιρέσεις, οι οποίες θα έχουν τη μορφή προτασιακών διανυσμάτων, οι απαραίτητες πληροφορίες για την, αρχικά, ομαδοποίηση αυτών ως προς τη σημασιολογία και ακολούθως την εξαγωγή, διατήρηση και παράφραση των κυριοτέρων σημείων του κειμένου, προκειμένου η ζητούμενη σύνοψη, ιδανικά, καταρχάς να επιτυγχάνει ως προς την συνοχή και ακολούθως να μην υπολείπεται ουσιωδώς του κειμένου ως προς το πληροφοριακό περιεχόμενο.