Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα

Στην παρούσα διπλωματική εργασία παρουσιάζεται ο έλεγχος του εργαλείου NLTK (Natural Language Toolkit) της Python. Συγκεκριμένα, το nltk είναι μια ανοιχτού κώδικα βιβλιοθήκη συναρτήσεων για επεξεργασία φυσικής γλώσσας και ανάπτυξη ανάλογων εφαρμογών. Έχει αναπτυχθεί σε γλώσσα Python με στόχο την ανά...

Full description

Bibliographic Details
Main Author: Σταυλιώτης, Λεωνίδας
Other Authors: Σγάρμπας, Κυριάκος
Format: Thesis
Language:Greek
Published: 2012
Subjects:
Online Access:http://hdl.handle.net/10889/5243
id nemertes-10889-5243
record_format dspace
spelling nemertes-10889-52432022-09-05T14:05:25Z Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα Σταυλιώτης, Λεωνίδας Σγάρμπας, Κυριάκος Σγάρμπας, Κυριάκος Φακωτάκης, Νικόλαος Stauliotis, Leonidas Ανάπτυξη φυσικής γλώσσας Επεξεργασία φυσικής γλώσσας Natural language toolkit Natural language processing Python 005.133 Στην παρούσα διπλωματική εργασία παρουσιάζεται ο έλεγχος του εργαλείου NLTK (Natural Language Toolkit) της Python. Συγκεκριμένα, το nltk είναι μια ανοιχτού κώδικα βιβλιοθήκη συναρτήσεων για επεξεργασία φυσικής γλώσσας και ανάπτυξη ανάλογων εφαρμογών. Έχει αναπτυχθεί σε γλώσσα Python με στόχο την ανάλυση και ανάπτυξη εφαρμογών κυρίως για την Αγγλική γλώσσα. Αντικείμενο αυτής της εργασίας είναι η συστηματική μελέτη και ο έλεγχος των συναρτήσεων του nltk για την Ελληνική γλώσσα, καθώς υπάρχουν ενδείξεις ότι σημαντικό μέρος αυτών δουλεύει σωστά. Αρχικά, έγινε η μελέτη για εισαγωγή ελληνικών κειμένων, καθώς και κατάλληλη επεξεργασία αυτών, ώστε να είναι σε επεξεργάσιμη μορφή από το εργαλείο. Έπειτα, ελέγχθησαν όλες οι εντολές και κατηγοριοποιήθηκαν με βάση τη λειτουργία τους. Τέλος, παρατηρώντας τα συγκεντρωτικά αποτελέσματα, εξάγεται το συμπέρασμα ότι οι υποψίες για σωστή λειτουργία μεγάλου αριθμού εντολών επαληθεύονται, καθώς το 87,9 % των εντολών φαίνεται να λειτουργεί σωστά. This diploma dissertation presents the examination of Python NLTK (Natural Language Toolkit) tool. Particularly, nltk is an open source function library suitable for natural language processing and the development of respective applications. It has been developed into Python language in order to analyse and develop applications mostly for the English language. The present dissertation is concerned with the systematic study and the examination of nltk functions for the Greek language, given that there is evidence of the correct operation of some. At first, research for the input of Greek texts as well as their appropriate processing was conducted as a way of presenting these texts in a processable by the tool form. Thereupon, all functions were tested and categorised in terms of their operation. Finally, the observation of concentrated results leads to the conclusion that the initial hypothesis for the correct operation of a great number of order is confirmed, as 87,9% of the functions appears to be operating correctly. 2012-05-14T07:17:50Z 2012-05-14T07:17:50Z 2012-02-15 2012-05-14 Thesis http://hdl.handle.net/10889/5243 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ανάπτυξη φυσικής γλώσσας
Επεξεργασία φυσικής γλώσσας
Natural language toolkit
Natural language processing
Python
005.133
spellingShingle Ανάπτυξη φυσικής γλώσσας
Επεξεργασία φυσικής γλώσσας
Natural language toolkit
Natural language processing
Python
005.133
Σταυλιώτης, Λεωνίδας
Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
description Στην παρούσα διπλωματική εργασία παρουσιάζεται ο έλεγχος του εργαλείου NLTK (Natural Language Toolkit) της Python. Συγκεκριμένα, το nltk είναι μια ανοιχτού κώδικα βιβλιοθήκη συναρτήσεων για επεξεργασία φυσικής γλώσσας και ανάπτυξη ανάλογων εφαρμογών. Έχει αναπτυχθεί σε γλώσσα Python με στόχο την ανάλυση και ανάπτυξη εφαρμογών κυρίως για την Αγγλική γλώσσα. Αντικείμενο αυτής της εργασίας είναι η συστηματική μελέτη και ο έλεγχος των συναρτήσεων του nltk για την Ελληνική γλώσσα, καθώς υπάρχουν ενδείξεις ότι σημαντικό μέρος αυτών δουλεύει σωστά. Αρχικά, έγινε η μελέτη για εισαγωγή ελληνικών κειμένων, καθώς και κατάλληλη επεξεργασία αυτών, ώστε να είναι σε επεξεργάσιμη μορφή από το εργαλείο. Έπειτα, ελέγχθησαν όλες οι εντολές και κατηγοριοποιήθηκαν με βάση τη λειτουργία τους. Τέλος, παρατηρώντας τα συγκεντρωτικά αποτελέσματα, εξάγεται το συμπέρασμα ότι οι υποψίες για σωστή λειτουργία μεγάλου αριθμού εντολών επαληθεύονται, καθώς το 87,9 % των εντολών φαίνεται να λειτουργεί σωστά.
author2 Σγάρμπας, Κυριάκος
author_facet Σγάρμπας, Κυριάκος
Σταυλιώτης, Λεωνίδας
format Thesis
author Σταυλιώτης, Λεωνίδας
author_sort Σταυλιώτης, Λεωνίδας
title Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
title_short Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
title_full Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
title_fullStr Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
title_full_unstemmed Μελέτη και έλεγχος του Python Natural Language Toolkit στην ελληνική γλώσσα
title_sort μελέτη και έλεγχος του python natural language toolkit στην ελληνική γλώσσα
publishDate 2012
url http://hdl.handle.net/10889/5243
work_keys_str_mv AT stauliōtēsleōnidas meletēkaielenchostoupythonnaturallanguagetoolkitstēnellēnikēglōssa
_version_ 1771297264770220032