Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15867 |
id |
nemertes-10889-15867 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-158672022-09-05T09:40:48Z Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας Graphical Improvments on the Graph-Based Extension of the Set-Based Model for Information Retrieval Σκαμνέλος, Νικόλαος Skamnelos, Nikolaos Ανάκτηση πληροφορίας Γραφήματα Set-based μοντέλα Graphical set-based μοντέλο ανάκτησης πληροφορίας Information retrieval Graphs Set-based model Graph-based extensions Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλληλεξάρτηση κάθε όρου με όλους τους υπόλοιπους. Συνεπώς, ορίζεται ένα τμήμα ή και τμήματα κειμένου - παράθυρο - αλληλεξάρτησης στο οποίο εφαρμόζονται αλγόριθμοι παραγωγής γραφημάτων, δημιουργώντας έτσι γραφήματα με ουσιαστικότερη δομική ισχύ. Προτείνονται αρκετές μέθοδοι που προσεγγίζουν μέγεθος παραθύρου με βάση το μέγεθος κειμένου, ενώ δοκιμάζεται και μία μέθοδος που συνδυάζει πολλαπλά παράθυρα προσεγγίζοντας τη σχέση πρότασης - παραγράφου. Σημαντική παρατήρηση στη συγκεκριμένη προσέγγιση είναι η ύπαρξη ακμών που δρουν ως γέφυρες μεταξύ των υπογραφημάτων κάθε παραθύρου. Για τον λόγο αυτό γίνεται μελέτη των συγκεκριμένων κόμβων και ακμών ως προς την νοηματική σημασία τους. Αυτό, λοιπόν, μεταφράζεται σε εντοπισμό ασήμαντων κόμβων - stop-words αρχικά μεταξύ των γεφυρών με μεθόδους αποσύνθεσης σε επίπεδα πυρήνα ενώ τελικά προτείνεται μία μέθοδο δειγματοληψίας και εντοπισμού τέτοιων λέξεων σε ολόκληρη τη συλλογή. The aim of this thesis is to improve upon the graphs generated by the Graphical Set-based model, while focusing on the dependence among document terms. The Graphical Set-based model generates complete graphs, which means that every term of a given document is interdependent with the rest. Therefore, we define an interdependence part or parts of a document, called windows, in which we apply graph generation algorithms, thus creating more cohesive graphs. The proposed methods approximate the size of the window based on document length in words. There is also an attempt at creating an algorithm that combines multiple windows, thus approaching a sentence - paragraph relationship. For that reason, we elaborate on such nodes and edges on their semantic importance. Finally, the problem is consider a stop-word detection issue on bridge nodes, implementing algorithms using core decomposition resulting at last into a collection sampling method as a solution on the aforementioned problem. 2022-03-01T06:31:01Z 2022-03-01T06:31:01Z 2022-02-23 http://hdl.handle.net/10889/15867 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ανάκτηση πληροφορίας Γραφήματα Set-based μοντέλα Graphical set-based μοντέλο ανάκτησης πληροφορίας Information retrieval Graphs Set-based model Graph-based extensions |
spellingShingle |
Ανάκτηση πληροφορίας Γραφήματα Set-based μοντέλα Graphical set-based μοντέλο ανάκτησης πληροφορίας Information retrieval Graphs Set-based model Graph-based extensions Σκαμνέλος, Νικόλαος Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
description |
Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλληλεξάρτηση κάθε όρου με όλους τους υπόλοιπους. Συνεπώς, ορίζεται ένα τμήμα ή και τμήματα κειμένου - παράθυρο - αλληλεξάρτησης στο οποίο εφαρμόζονται αλγόριθμοι παραγωγής γραφημάτων, δημιουργώντας έτσι γραφήματα με ουσιαστικότερη δομική ισχύ. Προτείνονται αρκετές μέθοδοι που προσεγγίζουν μέγεθος παραθύρου με βάση το μέγεθος κειμένου, ενώ δοκιμάζεται και μία μέθοδος που συνδυάζει πολλαπλά παράθυρα προσεγγίζοντας τη σχέση πρότασης - παραγράφου. Σημαντική παρατήρηση στη συγκεκριμένη προσέγγιση είναι η ύπαρξη ακμών που δρουν ως γέφυρες μεταξύ των υπογραφημάτων κάθε παραθύρου. Για τον λόγο αυτό γίνεται μελέτη των συγκεκριμένων κόμβων και ακμών ως προς την νοηματική σημασία τους. Αυτό, λοιπόν, μεταφράζεται σε εντοπισμό ασήμαντων κόμβων - stop-words αρχικά μεταξύ των γεφυρών με μεθόδους αποσύνθεσης σε επίπεδα πυρήνα ενώ τελικά προτείνεται μία μέθοδο
δειγματοληψίας και εντοπισμού τέτοιων λέξεων σε ολόκληρη τη συλλογή. |
author2 |
Skamnelos, Nikolaos |
author_facet |
Skamnelos, Nikolaos Σκαμνέλος, Νικόλαος |
author |
Σκαμνέλος, Νικόλαος |
author_sort |
Σκαμνέλος, Νικόλαος |
title |
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
title_short |
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
title_full |
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
title_fullStr |
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
title_full_unstemmed |
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
title_sort |
βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/15867 |
work_keys_str_mv |
AT skamnelosnikolaos beltistopoiēsēgraphēmatōntougraphicalsetbasedmontelouanaktēsēsplērophorias AT skamnelosnikolaos graphicalimprovmentsonthegraphbasedextensionofthesetbasedmodelforinformationretrieval |
_version_ |
1771297193015115777 |