Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας
Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/25423 |
id |
nemertes-10889-25423 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-254232023-07-08T04:01:02Z Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας Study the effect of the union graph of a Set-Based model extension implementing graphs on information retrieval Σωτηροπούλου, Παναγιώτα Sotiropoulou, Panagiota Διάνυσμα κειμένου Ενιαίο γράφημα Βαθμός κόμβου Document vector Union graph Degree node Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας έτσι πιο δομικά ισχυρά γραφήματα. Ανάλογα με τον αλγόριθμο που χρησιμοποιείται, τα κείμενα μιας συλλογής αναπαρίστανται ως γραφήματα και στην συνέχεια, κατά συνέπεια παράγονται τα ανεστραμμένα ευρετήρια τα οποία τελικά, θα οδηγήσουν σε μία διανυσματική αναπαράσταση κάθε κειμένου και ερωτήματος προκειμένου να παραχθεί μία – με βάση το ερώτημα - κατάταξη. Στην παρούσα εργασία, αντικαθιστούμε το βάρος που προκύπτει από το ενιαίο γράφημα με μία μετρική, βασισμένη στον βαθμό, αναπαράστασης κειμένου ερωτήματος κατά την διαδικασία της ανάκτησης. Επίσης, παρουσιάζεται ένας νέος τρόπος παραγωγής διανυσμάτων κειμένου, ο οποίος βασίζεται στον βαθμό των κόμβων κάθε γραφήματος κειμένου, καθώς προτείνεται και μία διαφοροποίηση στον υπολογισμό της συχνότητας του Set-Based μοντέλου. The aim of this thesis is to study the effect of the union graph of a Set – Based model extension implementing graphs. A further addition to the model that has been applied consisted of the use of windows, where each document in the collection is divided into segments, thus creating more structurally robust graphs. Depending on the algorithm used, the documents of a collection are represented as graphs and then, as a consequence inverted indexes are generated, which will, finally, result to a vector representation of each document and query in order to produce a – based on query - ranking. In this paper, we replace the weight derived from the union graph with degree-based metric of the document, query representation during the retrieval process. Furthermore, a new way of generating document vectors is presented, which are based on nodes’ degree of each document graph, as well as a modification on the Set-Based model frequency calculation is proposed. 2023-07-07T06:38:21Z 2023-07-07T06:38:21Z 2023-07-06 https://hdl.handle.net/10889/25423 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Διάνυσμα κειμένου Ενιαίο γράφημα Βαθμός κόμβου Document vector Union graph Degree node |
spellingShingle |
Διάνυσμα κειμένου Ενιαίο γράφημα Βαθμός κόμβου Document vector Union graph Degree node Σωτηροπούλου, Παναγιώτα Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
description |
Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας έτσι πιο δομικά ισχυρά γραφήματα. Ανάλογα με τον αλγόριθμο που χρησιμοποιείται, τα κείμενα μιας συλλογής αναπαρίστανται ως γραφήματα και στην συνέχεια, κατά συνέπεια παράγονται τα ανεστραμμένα ευρετήρια τα οποία τελικά, θα οδηγήσουν σε μία διανυσματική αναπαράσταση κάθε κειμένου και ερωτήματος προκειμένου να παραχθεί μία – με βάση το ερώτημα - κατάταξη. Στην παρούσα εργασία, αντικαθιστούμε το βάρος που προκύπτει από το ενιαίο γράφημα με μία μετρική, βασισμένη στον βαθμό, αναπαράστασης κειμένου ερωτήματος κατά την διαδικασία της ανάκτησης. Επίσης, παρουσιάζεται ένας νέος τρόπος παραγωγής διανυσμάτων κειμένου, ο οποίος βασίζεται στον βαθμό των κόμβων κάθε γραφήματος κειμένου, καθώς προτείνεται και μία διαφοροποίηση στον υπολογισμό της συχνότητας του Set-Based μοντέλου. |
author2 |
Sotiropoulou, Panagiota |
author_facet |
Sotiropoulou, Panagiota Σωτηροπούλου, Παναγιώτα |
author |
Σωτηροπούλου, Παναγιώτα |
author_sort |
Σωτηροπούλου, Παναγιώτα |
title |
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
title_short |
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
title_full |
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
title_fullStr |
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
title_full_unstemmed |
Μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
title_sort |
μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του set-based μοντέλου με γραφήματα στην ανάκτηση πληροφορίας |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/25423 |
work_keys_str_mv |
AT sōtēropouloupanagiōta meletētēsepidrasēstoueniaiougraphēmatostēsepektasēstousetbasedmonteloumegraphēmatastēnanaktēsēplērophorias AT sōtēropouloupanagiōta studytheeffectoftheuniongraphofasetbasedmodelextensionimplementinggraphsoninformationretrieval |
_version_ |
1771297334279274496 |