Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας

Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σκαμνέλος, Νικόλαος
Άλλοι συγγραφείς: Skamnelos, Nikolaos
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15867
id nemertes-10889-15867
record_format dspace
spelling nemertes-10889-158672022-09-05T09:40:48Z Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας Graphical Improvments on the Graph-Based Extension of the Set-Based Model for Information Retrieval Σκαμνέλος, Νικόλαος Skamnelos, Nikolaos Ανάκτηση πληροφορίας Γραφήματα Set-based μοντέλα Graphical set-based μοντέλο ανάκτησης πληροφορίας Information retrieval Graphs Set-based model Graph-based extensions Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλληλεξάρτηση κάθε όρου με όλους τους υπόλοιπους. Συνεπώς, ορίζεται ένα τμήμα ή και τμήματα κειμένου - παράθυρο - αλληλεξάρτησης στο οποίο εφαρμόζονται αλγόριθμοι παραγωγής γραφημάτων, δημιουργώντας έτσι γραφήματα με ουσιαστικότερη δομική ισχύ. Προτείνονται αρκετές μέθοδοι που προσεγγίζουν μέγεθος παραθύρου με βάση το μέγεθος κειμένου, ενώ δοκιμάζεται και μία μέθοδος που συνδυάζει πολλαπλά παράθυρα προσεγγίζοντας τη σχέση πρότασης - παραγράφου. Σημαντική παρατήρηση στη συγκεκριμένη προσέγγιση είναι η ύπαρξη ακμών που δρουν ως γέφυρες μεταξύ των υπογραφημάτων κάθε παραθύρου. Για τον λόγο αυτό γίνεται μελέτη των συγκεκριμένων κόμβων και ακμών ως προς την νοηματική σημασία τους. Αυτό, λοιπόν, μεταφράζεται σε εντοπισμό ασήμαντων κόμβων - stop-words αρχικά μεταξύ των γεφυρών με μεθόδους αποσύνθεσης σε επίπεδα πυρήνα ενώ τελικά προτείνεται μία μέθοδο δειγματοληψίας και εντοπισμού τέτοιων λέξεων σε ολόκληρη τη συλλογή. The aim of this thesis is to improve upon the graphs generated by the Graphical Set-based model, while focusing on the dependence among document terms. The Graphical Set-based model generates complete graphs, which means that every term of a given document is interdependent with the rest. Therefore, we define an interdependence part or parts of a document, called windows, in which we apply graph generation algorithms, thus creating more cohesive graphs. The proposed methods approximate the size of the window based on document length in words. There is also an attempt at creating an algorithm that combines multiple windows, thus approaching a sentence - paragraph relationship. For that reason, we elaborate on such nodes and edges on their semantic importance. Finally, the problem is consider a stop-word detection issue on bridge nodes, implementing algorithms using core decomposition resulting at last into a collection sampling method as a solution on the aforementioned problem. 2022-03-01T06:31:01Z 2022-03-01T06:31:01Z 2022-02-23 http://hdl.handle.net/10889/15867 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ανάκτηση πληροφορίας
Γραφήματα
Set-based μοντέλα
Graphical set-based μοντέλο ανάκτησης πληροφορίας
Information retrieval
Graphs
Set-based model
Graph-based extensions
spellingShingle Ανάκτηση πληροφορίας
Γραφήματα
Set-based μοντέλα
Graphical set-based μοντέλο ανάκτησης πληροφορίας
Information retrieval
Graphs
Set-based model
Graph-based extensions
Σκαμνέλος, Νικόλαος
Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
description Στόχος την παρούσας διπλωματικής εργασίας αποτελεί η βελτίωση των γραφημάτων του επεκτεταμένου με γραφήματα Set - Based μοντέλου, δίνοντας έμφαση στην εξάρτηση μεταξύ των όρων. Τα γραφήματα που παράγονται από το επεκτεταμένο με γραφήματα Set - Based μοντέλο είναι πλήρη, πράγμα που μεταφράζεται σε αλληλεξάρτηση κάθε όρου με όλους τους υπόλοιπους. Συνεπώς, ορίζεται ένα τμήμα ή και τμήματα κειμένου - παράθυρο - αλληλεξάρτησης στο οποίο εφαρμόζονται αλγόριθμοι παραγωγής γραφημάτων, δημιουργώντας έτσι γραφήματα με ουσιαστικότερη δομική ισχύ. Προτείνονται αρκετές μέθοδοι που προσεγγίζουν μέγεθος παραθύρου με βάση το μέγεθος κειμένου, ενώ δοκιμάζεται και μία μέθοδος που συνδυάζει πολλαπλά παράθυρα προσεγγίζοντας τη σχέση πρότασης - παραγράφου. Σημαντική παρατήρηση στη συγκεκριμένη προσέγγιση είναι η ύπαρξη ακμών που δρουν ως γέφυρες μεταξύ των υπογραφημάτων κάθε παραθύρου. Για τον λόγο αυτό γίνεται μελέτη των συγκεκριμένων κόμβων και ακμών ως προς την νοηματική σημασία τους. Αυτό, λοιπόν, μεταφράζεται σε εντοπισμό ασήμαντων κόμβων - stop-words αρχικά μεταξύ των γεφυρών με μεθόδους αποσύνθεσης σε επίπεδα πυρήνα ενώ τελικά προτείνεται μία μέθοδο δειγματοληψίας και εντοπισμού τέτοιων λέξεων σε ολόκληρη τη συλλογή.
author2 Skamnelos, Nikolaos
author_facet Skamnelos, Nikolaos
Σκαμνέλος, Νικόλαος
author Σκαμνέλος, Νικόλαος
author_sort Σκαμνέλος, Νικόλαος
title Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
title_short Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
title_full Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
title_fullStr Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
title_full_unstemmed Βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
title_sort βελτιστοποίηση γραφημάτων του graphical set-based μοντέλου ανάκτησης πληροφορίας
publishDate 2022
url http://hdl.handle.net/10889/15867
work_keys_str_mv AT skamnelosnikolaos beltistopoiēsēgraphēmatōntougraphicalsetbasedmontelouanaktēsēsplērophorias
AT skamnelosnikolaos graphicalimprovmentsonthegraphbasedextensionofthesetbasedmodelforinformationretrieval
_version_ 1771297193015115777