Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας

Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σωτηροπούλου, Παναγιώτα
Άλλοι συγγραφείς: Sotiropoulou, Panagiota
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/25423
id nemertes-10889-25423
record_format dspace
spelling nemertes-10889-254232023-07-08T04:01:02Z Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας Study the effect of the union graph of a Set-Based model extension implementing graphs on information retrieval Σωτηροπούλου, Παναγιώτα Sotiropoulou, Panagiota Διάνυσμα κειμένου Ενιαίο γράφημα Βαθμός κόμβου Document vector Union graph Degree node Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας έτσι πιο δομικά ισχυρά γραφήματα. Ανάλογα με τον αλγόριθμο που χρησιμοποιείται, τα κείμενα μιας συλλογής αναπαρίστανται ως γραφήματα και στην συνέχεια, κατά συνέπεια παράγονται τα ανεστραμμένα ευρετήρια τα οποία τελικά, θα οδηγήσουν σε μία διανυσματική αναπαράσταση κάθε κειμένου και ερωτήματος προκειμένου να παραχθεί μία – με βάση το ερώτημα - κατάταξη. Στην παρούσα εργασία, αντικαθιστούμε το βάρος που προκύπτει από το ενιαίο γράφημα με μία μετρική, βασισμένη στον βαθμό, αναπαράστασης κειμένου ερωτήματος κατά την διαδικασία της ανάκτησης. Επίσης, παρουσιάζεται ένας νέος τρόπος παραγωγής διανυσμάτων κειμένου, ο οποίος βασίζεται στον βαθμό των κόμβων κάθε γραφήματος κειμένου, καθώς προτείνεται και μία διαφοροποίηση στον υπολογισμό της συχνότητας του Set-Based μοντέλου. The aim of this thesis is to study the effect of the union graph of a Set – Based model extension implementing graphs. A further addition to the model that has been applied consisted of the use of windows, where each document in the collection is divided into segments, thus creating more structurally robust graphs. Depending on the algorithm used, the documents of a collection are represented as graphs and then, as a consequence inverted indexes are generated, which will, finally, result to a vector representation of each document and query in order to produce a – based on query - ranking. In this paper, we replace the weight derived from the union graph with degree-based metric of the document, query representation during the retrieval process. Furthermore, a new way of generating document vectors is presented, which are based on nodes’ degree of each document graph, as well as a modification on the Set-Based model frequency calculation is proposed. 2023-07-07T06:38:21Z 2023-07-07T06:38:21Z 2023-07-06 https://hdl.handle.net/10889/25423 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Διάνυσμα κειμένου
Ενιαίο γράφημα
Βαθμός κόμβου
Document vector
Union graph
Degree node
spellingShingle Διάνυσμα κειμένου
Ενιαίο γράφημα
Βαθμός κόμβου
Document vector
Union graph
Degree node
Σωτηροπούλου, Παναγιώτα
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
description Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας έτσι πιο δομικά ισχυρά γραφήματα. Ανάλογα με τον αλγόριθμο που χρησιμοποιείται, τα κείμενα μιας συλλογής αναπαρίστανται ως γραφήματα και στην συνέχεια, κατά συνέπεια παράγονται τα ανεστραμμένα ευρετήρια τα οποία τελικά, θα οδηγήσουν σε μία διανυσματική αναπαράσταση κάθε κειμένου και ερωτήματος προκειμένου να παραχθεί μία – με βάση το ερώτημα - κατάταξη. Στην παρούσα εργασία, αντικαθιστούμε το βάρος που προκύπτει από το ενιαίο γράφημα με μία μετρική, βασισμένη στον βαθμό, αναπαράστασης κειμένου ερωτήματος κατά την διαδικασία της ανάκτησης. Επίσης, παρουσιάζεται ένας νέος τρόπος παραγωγής διανυσμάτων κειμένου, ο οποίος βασίζεται στον βαθμό των κόμβων κάθε γραφήματος κειμένου, καθώς προτείνεται και μία διαφοροποίηση στον υπολογισμό της συχνότητας του Set-Based μοντέλου.
author2 Sotiropoulou, Panagiota
author_facet Sotiropoulou, Panagiota
Σωτηροπούλου, Παναγιώτα
author Σωτηροπούλου, Παναγιώτα
author_sort Σωτηροπούλου, Παναγιώτα
title Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
title_short Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
title_full Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
title_fullStr Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
title_full_unstemmed Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
title_sort μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
publishDate 2023
url https://hdl.handle.net/10889/25423
work_keys_str_mv AT sōtēropouloupanagiōta meletētēsepidrasēstoueniaiougraphēmatostēsepektasēstousetbasedmonteloumegraphēmatastēnanaktēsēplērophorias
AT sōtēropouloupanagiōta studytheeffectoftheuniongraphofasetbasedmodelextensionimplementinggraphsoninformationretrieval
_version_ 1771297334279274496