Περίληψη: | Σήμερα το διαδίκτυο αποτελεί πρωταρχική πηγή αναζήτησης και γνώσης. Στον
παγκόσμιο ιστό, οι ψηφιακές βιβλιοθήκες και οι βάσεις δεδομένων περιέχουν εκατομμύρια
έγγραφα, αριθμός ο οποίος καθημερινά αυξάνεται. Το φαινόμενο αυτό απασχολεί πολλούς
ειδικούς καθώς, οι χρήστες αφιερώνουν πολύτιμο χρόνο στην προσπάθεια τους να
ανακτήσουν χρήσιμες πληροφορίες μέσα από τις μεγάλες συλλογές κειμένων.
Στην κατεύθυνση της επίλυσης του ανωτέρω προβλήματος, αναπτύχθηκε η τεχνική
της εξόρυξης γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους
της εξόρυξης γνώσης από κείμενα είναι η ομαδοποίηση, η οποία έχει ως σκοπό την
οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters).
Αντικείμενο της παρούσας μεταπτυχιακής εργασίας είναι, η επεξεργασία
συγκεκριμένου αριθμού νομικών εγγράφων και η δημιουργία εκ του μηδενός ενός λεξικού
συνωνύμων με όρους νομικού περιεχομένου. Σκοπός της, η ομαδοποίηση των εγγράφων
αυτών με και χωρίς τη χρήση του λεξικού ώστε να αξιολογηθεί η αποτελεσματικότητα
του.
|