Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο

Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγά...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κυριάκου, Ερωτόκριτος
Άλλοι συγγραφείς: Φακωτάκης, Νίκος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2009
Θέματα:
Διαθέσιμο Online:http://nemertes.lis.upatras.gr/jspui/handle/10889/2097
id nemertes-10889-2097
record_format dspace
spelling nemertes-10889-20972022-09-05T04:45:10Z Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο Κυριάκου, Ερωτόκριτος Φακωτάκης, Νίκος Σγάρμπας, Κυριάκος Φακωτάκης, Νίκος Kyriakou, Erotokritos Περίληψη Σύνοψη Απόσπασμα Summarization Abstraction Extraction 025.402 85 Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου. This diploma dissertation is about automatic text summarization for the Greek language. Information retrieval is a field of natural language processing which is a subfield of Artificial Intelligence. Its purpose is to retrieve important information out of large collections of data. The specific domain that concentrates on text-data and the extraction of short summaries is called automatic text summarization. A computer program that summarizes a text. The summarizer removes redundant information from the input text and produces a shorter non-redundant output text. The output text is an extract from the original text. With extract, we mean that no sentence is produced from scratch, but instead original sentences are used to form the summary. The most important sentences are chosen by application of some criteria that are specially designed to rank each sentence. The results are compared to human made summaries and to some well-known summarization programs. 2009-10-20T08:01:10Z 2009-10-20T08:01:10Z 2009-07-22 2009-10-20T08:01:10Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/2097 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Περίληψη
Σύνοψη
Απόσπασμα
Summarization
Abstraction
Extraction
025.402 85
spellingShingle Περίληψη
Σύνοψη
Απόσπασμα
Summarization
Abstraction
Extraction
025.402 85
Κυριάκου, Ερωτόκριτος
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
description Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου.
author2 Φακωτάκης, Νίκος
author_facet Φακωτάκης, Νίκος
Κυριάκου, Ερωτόκριτος
format Thesis
author Κυριάκου, Ερωτόκριτος
author_sort Κυριάκου, Ερωτόκριτος
title Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_short Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_full Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_fullStr Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_full_unstemmed Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
title_sort αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
publishDate 2009
url http://nemertes.lis.upatras.gr/jspui/handle/10889/2097
work_keys_str_mv AT kyriakouerōtokritos automatēexagōgēperilēpsēsapoellēnikokeimeno
_version_ 1771297126168395776