Περίληψη: | Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας.
Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρήση Wavelet Trees. Η πρώτη τεχνική αφορά τη χρήση ανεστραμμένων αρχείων (inverted files). Η δεύτερη, αφορά τη χρήση αυτοδεικτοδοτούμενων κειμένων (self indexed texts) . Οι δύο αυτές τεχνικές διαχειρίζονται την απάντηση ερωτημάτων καθώς και την υλοποίηση λειτουργιών χρήσιμων στην ανάκτηση πληροφορίας κειμένων.
Σκοπός της εργασίας είναι η υλοποίηση των αλγορίθμων των παραπάνω τεχνικών, η βελτιστοποίηση και η επέκταση τους. Με τον τρόπο αυτό, επιτυγχάνεται η εφαρμογή τους σε τρία είδη Wavelet Tree (Normal Shaped, Weight Balanced και Huffman Shaped). Επιπλέον, προτείνονται τρόποι με τους οποίους μπορούν να χρησιμοποιηθούν και να συνδυαστούν οι παραπάνω αλγόριθμοι στις δύο διαφορετικές τεχνικές και πραγματοποιείται πειραματική αξιολόγηση όλων των παραπάνω τεχνικών και σχημάτων, καθώς και μια κατανεμημένη επέκταση τους για πολιτικές caching.
|