Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο
Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγά...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2009
|
Θέματα: | |
Διαθέσιμο Online: | http://nemertes.lis.upatras.gr/jspui/handle/10889/2097 |
id |
nemertes-10889-2097 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-20972022-09-05T04:45:10Z Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο Κυριάκου, Ερωτόκριτος Φακωτάκης, Νίκος Σγάρμπας, Κυριάκος Φακωτάκης, Νίκος Kyriakou, Erotokritos Περίληψη Σύνοψη Απόσπασμα Summarization Abstraction Extraction 025.402 85 Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου. This diploma dissertation is about automatic text summarization for the Greek language. Information retrieval is a field of natural language processing which is a subfield of Artificial Intelligence. Its purpose is to retrieve important information out of large collections of data. The specific domain that concentrates on text-data and the extraction of short summaries is called automatic text summarization. A computer program that summarizes a text. The summarizer removes redundant information from the input text and produces a shorter non-redundant output text. The output text is an extract from the original text. With extract, we mean that no sentence is produced from scratch, but instead original sentences are used to form the summary. The most important sentences are chosen by application of some criteria that are specially designed to rank each sentence. The results are compared to human made summaries and to some well-known summarization programs. 2009-10-20T08:01:10Z 2009-10-20T08:01:10Z 2009-07-22 2009-10-20T08:01:10Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/2097 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Περίληψη Σύνοψη Απόσπασμα Summarization Abstraction Extraction 025.402 85 |
spellingShingle |
Περίληψη Σύνοψη Απόσπασμα Summarization Abstraction Extraction 025.402 85 Κυριάκου, Ερωτόκριτος Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
description |
Η παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης εξαγωγής περίληψης από κείμενο ελληνικής γλώσσας. Η ανάκτηση πληροφορίας είναι ένας τομέας της επεξεργασίας φυσικής γλώσσας η οποία αποτελεί υποτομέα της Τεχνητής Νοημοσύνης. Σκοπός της είναι η ανάκτηση σημαντικών πληροφοριών από μεγάλες συλλογές δεδομένων. Ο συγκεκριμένος τομέας που συγκεντρώνεται στην εξαγωγή συνοπτικών περιλήψεων από κείμενα καλείται Αυτόματη Εξαγωγή Περίληψης Κειμένου. Το πρόγραμμα αφαιρεί τις πλεονάζουσες πληροφορίες από το κείμενο εισόδου και παράγει ένα μικρότερο, απαλλαγμένο από πλεονασμούς, κείμενο εξόδου. Το κείμενο αυτό είναι ένα extract από το αρχικό κείμενο. Με αυτό εννοούμε ότι καμία από τις νέες προτάσεις δεν παράγεται από την αρχή, αντ' αυτού, αρχικές μη τροποποιημένες προτάσεις χρησιμοποιούνται για να σχηματιστεί η περίληψη. Οι πιο σημαντικές προτάσεις επιλέγονται με την εφαρμογή κριτήριων που έχουν ειδικά σχεδιαστεί για να βαθμολογήσουν τη κάθε πρόταση. Το αποτέλεσμα συγκρίνεται με «ανθρώπινα» κατασκευασμένες περιλήψεις και με κάποια γνωστά προγράμματα αυτόματης σύνοψης κειμένου. |
author2 |
Φακωτάκης, Νίκος |
author_facet |
Φακωτάκης, Νίκος Κυριάκου, Ερωτόκριτος |
format |
Thesis |
author |
Κυριάκου, Ερωτόκριτος |
author_sort |
Κυριάκου, Ερωτόκριτος |
title |
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
title_short |
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
title_full |
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
title_fullStr |
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
title_full_unstemmed |
Αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
title_sort |
αυτόματη εξαγωγή περίληψης από ελληνικό κείμενο |
publishDate |
2009 |
url |
http://nemertes.lis.upatras.gr/jspui/handle/10889/2097 |
work_keys_str_mv |
AT kyriakouerōtokritos automatēexagōgēperilēpsēsapoellēnikokeimeno |
_version_ |
1771297126168395776 |