Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στην ταξινόμηση νομοθετικών διατάξεων

Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο σ...

Full description

Bibliographic Details
Main Author: Νιφόρας, Νικόλαος
Other Authors: Βουτσινάς, Βασίλειος
Format: Thesis
Language:Greek
Published: 2016
Subjects:
Online Access:http://hdl.handle.net/10889/9676
Description
Summary:Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο στην προσπάθεια τους να ανακτήσουν χρήσιμες πληροφορίες μέσα από τις μεγάλες συλλογές κειμένων. Στην κατεύθυνση της επίλυσης του ανωτέρω προβλήματος, αναπτύχθηκε η τεχνική της εξόρυξης γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους της εξόρυξης γνώσης από κείμενα είναι η ομαδοποίηση, η οποία έχει ως σκοπό την οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters). Αντικείμενο της παρούσας μεταπτυχιακής εργασίας είναι, η επεξεργασία συγκεκριμένου αριθμού νομικών εγγράφων και η δημιουργία εκ του μηδενός ενός λεξικού συνωνύμων με όρους νομικού περιεχομένου. Σκοπός της, η ομαδοποίηση των εγγράφων αυτών με και χωρίς τη χρήση του λεξικού ώστε να αξιολογηθεί η αποτελεσματικότητα του.