Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees
Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας. Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2018
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/11281 |
id |
nemertes-10889-11281 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-112812022-09-05T14:00:49Z Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees Indexing techniques for information retrieval systems, using wavelet trees Κατσίπη, Δήμητρα Μακρής, Χρήστος Μακρής, Χρήστος Βούλγαρης, Σπυρίδωνας Χατζηλυγερούδης, Ιωάννης Katsipi, Dimitra Δενδρικές δομές δεδομένων Ανάκτηση πληροφορίας Wavelet trees 025.04 Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας. Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρήση Wavelet Trees. Η πρώτη τεχνική αφορά τη χρήση ανεστραμμένων αρχείων (inverted files). Η δεύτερη, αφορά τη χρήση αυτοδεικτοδοτούμενων κειμένων (self indexed texts) . Οι δύο αυτές τεχνικές διαχειρίζονται την απάντηση ερωτημάτων καθώς και την υλοποίηση λειτουργιών χρήσιμων στην ανάκτηση πληροφορίας κειμένων. Σκοπός της εργασίας είναι η υλοποίηση των αλγορίθμων των παραπάνω τεχνικών, η βελτιστοποίηση και η επέκταση τους. Με τον τρόπο αυτό, επιτυγχάνεται η εφαρμογή τους σε τρία είδη Wavelet Tree (Normal Shaped, Weight Balanced και Huffman Shaped). Επιπλέον, προτείνονται τρόποι με τους οποίους μπορούν να χρησιμοποιηθούν και να συνδυαστούν οι παραπάνω αλγόριθμοι στις δύο διαφορετικές τεχνικές και πραγματοποιείται πειραματική αξιολόγηση όλων των παραπάνω τεχνικών και σχημάτων, καθώς και μια κατανεμημένη επέκταση τους για πολιτικές caching. Wavelet Trees are binary tree data structures originally used for text compression. They were then used for text indexing and information retrieval. In the present master thesis, two basic information retrieval techniques are presented using Wavelet Trees. The first technique involves the use of inverted files. The second involves the use of self-indexed texts. These two techniques handle query answering as well as the implementation of functions useful in information retrieval. The aim of the thesis is to implement the algorithms of the above techniques, to optimize them and to extend them. The techniques and algorithms are applied on three types of Wavelet Trees (Normal Shaped, Weight Balanced and Huffman Shaped). In addition, we propose ways in which these algorithms can be used and combined with each other using the two different text indexing techniques. An experimental evaluation of all the above techniques and schemas is presented, as well as a distributed extension for caching policies. 2018-05-16T08:44:37Z 2018-05-16T08:44:37Z 2017-09 Thesis http://hdl.handle.net/10889/11281 gr 6 application/pdf application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Δενδρικές δομές δεδομένων Ανάκτηση πληροφορίας Wavelet trees 025.04 |
spellingShingle |
Δενδρικές δομές δεδομένων Ανάκτηση πληροφορίας Wavelet trees 025.04 Κατσίπη, Δήμητρα Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
description |
Τα Wavelet Trees είναι δενδρικές δομές δεδομένων που αρχικά χρησιμοποιήθηκαν για συμπίεση κειμένου. Στη συνέχεια χρησιμοποιήθηκαν για τη δεικτοδότηση κειμένου και την ανάκτηση πληροφορίας.
Στην προκείμενη διπλωματική εργασία παρουσιάζονται αρχικά δύο βασικές τεχνικές ανάκτησης πληροφορίας με τη χρήση Wavelet Trees. Η πρώτη τεχνική αφορά τη χρήση ανεστραμμένων αρχείων (inverted files). Η δεύτερη, αφορά τη χρήση αυτοδεικτοδοτούμενων κειμένων (self indexed texts) . Οι δύο αυτές τεχνικές διαχειρίζονται την απάντηση ερωτημάτων καθώς και την υλοποίηση λειτουργιών χρήσιμων στην ανάκτηση πληροφορίας κειμένων.
Σκοπός της εργασίας είναι η υλοποίηση των αλγορίθμων των παραπάνω τεχνικών, η βελτιστοποίηση και η επέκταση τους. Με τον τρόπο αυτό, επιτυγχάνεται η εφαρμογή τους σε τρία είδη Wavelet Tree (Normal Shaped, Weight Balanced και Huffman Shaped). Επιπλέον, προτείνονται τρόποι με τους οποίους μπορούν να χρησιμοποιηθούν και να συνδυαστούν οι παραπάνω αλγόριθμοι στις δύο διαφορετικές τεχνικές και πραγματοποιείται πειραματική αξιολόγηση όλων των παραπάνω τεχνικών και σχημάτων, καθώς και μια κατανεμημένη επέκταση τους για πολιτικές caching. |
author2 |
Μακρής, Χρήστος |
author_facet |
Μακρής, Χρήστος Κατσίπη, Δήμητρα |
format |
Thesis |
author |
Κατσίπη, Δήμητρα |
author_sort |
Κατσίπη, Δήμητρα |
title |
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
title_short |
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
title_full |
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
title_fullStr |
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
title_full_unstemmed |
Τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
title_sort |
τεχνικές δεικτοδότησης συστημάτων ανάκτησης πληροφορίας με τη χρήση wavelet trees |
publishDate |
2018 |
url |
http://hdl.handle.net/10889/11281 |
work_keys_str_mv |
AT katsipēdēmētra technikesdeiktodotēsēssystēmatōnanaktēsēsplērophoriasmetēchrēsēwavelettrees AT katsipēdēmētra indexingtechniquesforinformationretrievalsystemsusingwavelettrees |
_version_ |
1771297225333276672 |