Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees

Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας. Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κατσίπη, Δήμητρα
Άλλοι συγγραφείς: Μακρής, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/11281
id nemertes-10889-11281
record_format dspace
spelling nemertes-10889-112812022-09-05T14:00:49Z Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees Indexing techniques for information retrieval systems, using wavelet trees Κατσίπη, Δήμητρα Μακρής, Χρήστος Μακρής, Χρήστος Βούλγαρης, Σπυρίδωνας Χατζηλυγερούδης, Ιωάννης Katsipi, Dimitra Δενδρικές δομές δεδομένων Ανάκτηση πληροφορίας Wavelet trees 025.04 Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας. Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρήση Wavelet Trees. Η πρώτη τεχνική αφορά τη χρήση ανεστραμμένων αρχείων (inverted files). Η δεύτερη, αφορά τη χρήση αυτοδεικτοδοτούμενων κειμένων (self indexed texts) . Οι δύο αυτές τεχνικές διαχειρίζονται την απάντηση ερωτημάτων καθώς και την υλοποίηση λειτουργιών χρήσιμων στην ανάκτηση πληροφορίας κειμένων. Σκοπός της εργασίας είναι η υλοποίηση των αλγορίθμων των παραπάνω τεχνικών, η βελτιστοποίηση και η επέκταση τους. Με τον τρόπο αυτό, επιτυγχάνεται η εφαρμογή τους σε τρία είδη Wavelet Tree (Normal Shaped, Weight Balanced και Huffman Shaped). Επιπλέον, προτείνονται τρόποι με τους οποίους μπορούν να χρησιμοποιηθούν και να συνδυαστούν οι παραπάνω αλγόριθμοι στις δύο διαφορετικές τεχνικές και πραγματοποιείται πειραματική αξιολόγηση όλων των παραπάνω τεχνικών και σχημάτων, καθώς και μια κατανεμημένη επέκταση τους για πολιτικές caching. Wavelet Trees are binary tree data structures originally used for text compression. They were then used for text indexing and information retrieval. In the present master thesis, two basic information retrieval techniques are presented using Wavelet Trees. The first technique involves the use of inverted files. The second involves the use of self-indexed texts. These two techniques handle query answering as well as the implementation of functions useful in information retrieval. The aim of the thesis is to implement the algorithms of the above techniques, to optimize them and to extend them. The techniques and algorithms are applied on three types of Wavelet Trees (Normal Shaped, Weight Balanced and Huffman Shaped). In addition, we propose ways in which these algorithms can be used and combined with each other using the two different text indexing techniques. An experimental evaluation of all the above techniques and schemas is presented, as well as a distributed extension for caching policies. 2018-05-16T08:44:37Z 2018-05-16T08:44:37Z 2017-09 Thesis http://hdl.handle.net/10889/11281 gr 6 application/pdf application/pdf
institution UPatras
collection Nemertes
language Greek
topic Δενδρικές δομές δεδομένων
Ανάκτηση πληροφορίας
Wavelet trees
025.04
spellingShingle Δενδρικές δομές δεδομένων
Ανάκτηση πληροφορίας
Wavelet trees
025.04
Κατσίπη, Δήμητρα
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
description Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας. Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρήση Wavelet Trees. Η πρώτη τεχνική αφορά τη χρήση ανεστραμμένων αρχείων (inverted files). Η δεύτερη, αφορά τη χρήση αυτοδεικτοδοτούμενων κειμένων (self indexed texts) . Οι δύο αυτές τεχνικές διαχειρίζονται την απάντηση ερωτημάτων καθώς και την υλοποίηση λειτουργιών χρήσιμων στην ανάκτηση πληροφορίας κειμένων. Σκοπός της εργασίας είναι η υλοποίηση των αλγορίθμων των παραπάνω τεχνικών, η βελτιστοποίηση και η επέκταση τους. Με τον τρόπο αυτό, επιτυγχάνεται η εφαρμογή τους σε τρία είδη Wavelet Tree (Normal Shaped, Weight Balanced και Huffman Shaped). Επιπλέον, προτείνονται τρόποι με τους οποίους μπορούν να χρησιμοποιηθούν και να συνδυαστούν οι παραπάνω αλγόριθμοι στις δύο διαφορετικές τεχνικές και πραγματοποιείται πειραματική αξιολόγηση όλων των παραπάνω τεχνικών και σχημάτων, καθώς και μια κατανεμημένη επέκταση τους για πολιτικές caching.
author2 Μακρής, Χρήστος
author_facet Μακρής, Χρήστος
Κατσίπη, Δήμητρα
format Thesis
author Κατσίπη, Δήμητρα
author_sort Κατσίπη, Δήμητρα
title Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
title_short Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
title_full Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
title_fullStr Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
title_full_unstemmed Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
title_sort τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
publishDate 2018
url http://hdl.handle.net/10889/11281
work_keys_str_mv AT katsipēdēmētra technikesdeiktodotēsēssystēmatōnanaktēsēsplērophoriasmetēchrēsēwavelettrees
AT katsipēdēmētra indexingtechniquesforinformationretrievalsystemsusingwavelettrees
_version_ 1771297225333276672