Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας

Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σκαμνέλος, Νικόλαος
Άλλοι συγγραφείς: Skamnelos, Nikolaos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15867
Περιγραφή
Περίληψη:Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλληλεξάρτηση κάθε όρου με όλους τους υπόλοιπους. Συνεπώς, ορίζεται ένα τμήμα ή και τμήματα κειμένου - παράθυρο - αλληλεξάρτησης στο οποίο εφαρμόζονται αλγόριθμοι παραγωγής γραφημάτων, δημιουργώντας έτσι γραφήματα με ουσιαστικότερη δομική ισχύ. Προτείνονται αρκετές μέθοδοι που προσεγγίζουν μέγεθος παραθύρου με βάση το μέγεθος κειμένου, ενώ δοκιμάζεται και μία μέθοδος που συνδυάζει πολλαπλά παράθυρα προσεγγίζοντας τη σχέση πρότασης - παραγράφου. Σημαντική παρατήρηση στη συγκεκριμένη προσέγγιση είναι η ύπαρξη ακμών που δρουν ως γέφυρες μεταξύ των υπογραφημάτων κάθε παραθύρου. Για τον λόγο αυτό γίνεται μελέτη των συγκεκριμένων κόμβων και ακμών ως προς την νοηματική σημασία τους. Αυτό, λοιπόν, μεταφράζεται σε εντοπισμό ασήμαντων κόμβων - stop-words αρχικά μεταξύ των γεφυρών με μεθόδους αποσύνθεσης σε επίπεδα πυρήνα ενώ τελικά προτείνεται μία μέθοδο δειγματοληψίας και εντοπισμού τέτοιων λέξεων σε ολόκληρη τη συλλογή.