Περίληψη: | Στόχος της παρούσας διπλωματικής εργασίας αποτελεί η μελέτη της επίδρασης του ενιαίου γραφήματος της επέκτασης του Set – Based μοντέλου με γραφήματα. Μια επιπλέον προσθήκη που εφαρμόστηκε στο μοντέλο αυτό είναι η χρήση παραθύρων όπου κάθε ένα κείμενο της συλλογής χωρίζεται σε τμήματα, δημιουργώντας έτσι πιο δομικά ισχυρά γραφήματα. Ανάλογα με τον αλγόριθμο που χρησιμοποιείται, τα κείμενα μιας συλλογής αναπαρίστανται ως γραφήματα και στην συνέχεια, κατά συνέπεια παράγονται τα ανεστραμμένα ευρετήρια τα οποία τελικά, θα οδηγήσουν σε μία διανυσματική αναπαράσταση κάθε κειμένου και ερωτήματος προκειμένου να παραχθεί μία – με βάση το ερώτημα - κατάταξη. Στην παρούσα εργασία, αντικαθιστούμε το βάρος που προκύπτει από το ενιαίο γράφημα με μία μετρική, βασισμένη στον βαθμό, αναπαράστασης κειμένου ερωτήματος κατά την διαδικασία της ανάκτησης. Επίσης, παρουσιάζεται ένας νέος τρόπος παραγωγής διανυσμάτων κειμένου, ο οποίος βασίζεται στον βαθμό των κόμβων κάθε γραφήματος κειμένου, καθώς προτείνεται και μία διαφοροποίηση στον υπολογισμό της συχνότητας του Set-Based μοντέλου.
|