Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων
Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο σ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9676 |
id |
nemertes-10889-9676 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-96762022-09-05T14:07:50Z Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων Use of text mining techniques in legal texts' classification Νιφόρας, Νικόλαος Βουτσινάς, Βασίλειος Βουτσινάς, Βασίλειος Τσενέ, Χρυσούλα Γιαννίκος, Ιωάννης Niforas, Nikolaos Εξόρυξη γνώσης Δεδομένα Κείμενα Νομική Λεξικά Συνώνυμα Text mining Data Texts Laws Clusters 340.03 Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο στην προσπάθεια τους να ανακτήσουν χρήσιμες πληροφορίες μέσα από τις μεγάλες συλλογές κειμένων. Στην κατεύθυνση της επίλυσης του ανωτέρω προβλήματος, αναπτύχθηκε η τεχνική της εξόρυξης γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους της εξόρυξης γνώσης από κείμενα είναι η ομαδοποίηση, η οποία έχει ως σκοπό την οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters). Αντικείμενο της παρούσας μεταπτυχιακής εργασίας είναι, η επεξεργασία συγκεκριμένου αριθμού νομικών εγγράφων και η δημιουργία εκ του μηδενός ενός λεξικού συνωνύμων με όρους νομικού περιεχομένου. Σκοπός της, η ομαδοποίηση των εγγράφων αυτών με και χωρίς τη χρήση του λεξικού ώστε να αξιολογηθεί η αποτελεσματικότητα του. Nowadays, internet is the primary search and knowledge source. Digital libraries and databases contain millions of documents, a number that increases day by day. This phenomenon concerns a lot of experts, because a huge amount of people spend their time trying to retrieve useful information through vast text collections. In order to solve the aforementioned problem, experts have developed a new technique known as Text Mining. Besides, one of the most important Text Mining methods, is Clustering through which a vast volume of texts are categorized in groups (clusters). Subject of this thesis is the processing of a specific number of legal documents and the creation from scratch of a synonym dictionary with terms of legal interest. Target of this thesis is the documents clustering, with and without the dictionary’s help, in order to assess its effectiveness. 2016-10-17T07:41:38Z 2016-10-17T07:41:38Z 2016-08-24 Thesis http://hdl.handle.net/10889/9676 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξη γνώσης Δεδομένα Κείμενα Νομική Λεξικά Συνώνυμα Text mining Data Texts Laws Clusters 340.03 |
spellingShingle |
Εξόρυξη γνώσης Δεδομένα Κείμενα Νομική Λεξικά Συνώνυμα Text mining Data Texts Laws Clusters 340.03 Νιφόρας, Νικόλαος Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
description |
Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον
παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια
έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς
ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο στην προσπάθεια τους να
ανακτήσουν χρήσιμες πληροφορίες μέσα από τις μεγάλες συλλογές κειμένων.
Στην κατεύθυνση της επίλυσης του ανωτέρω προβλήματος, αναπτύχθηκε η τεχνική
της εξόρυξης γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους
της εξόρυξης γνώσης από κείμενα είναι η ομαδοποίηση, η οποία έχει ως σκοπό την
οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters).
Αντικείμενο της παρούσας μεταπτυχιακής εργασίας είναι, η επεξεργασία
συγκεκριμένου αριθμού νομικών εγγράφων και η δημιουργία εκ του μηδενός ενός λεξικού
συνωνύμων με όρους νομικού περιεχομένου. Σκοπός της, η ομαδοποίηση των εγγράφων
αυτών με και χωρίς τη χρήση του λεξικού ώστε να αξιολογηθεί η αποτελεσματικότητα
του. |
author2 |
Βουτσινάς, Βασίλειος |
author_facet |
Βουτσινάς, Βασίλειος Νιφόρας, Νικόλαος |
format |
Thesis |
author |
Νιφόρας, Νικόλαος |
author_sort |
Νιφόρας, Νικόλαος |
title |
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
title_short |
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
title_full |
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
title_fullStr |
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
title_full_unstemmed |
Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
title_sort |
χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων |
publishDate |
2016 |
url |
http://hdl.handle.net/10889/9676 |
work_keys_str_mv |
AT niphorasnikolaos chrēsētechnikōnexoryxēsapokeimenotextminingstēntaxinomēsēnomothetikōndiataxeōn AT niphorasnikolaos useoftextminingtechniquesinlegaltextsclassification |
_version_ |
1771297233872879616 |