Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων
Στην σύγχρονη εποχή το διαδίκτυο βρίσκεται πιο πολύ από ποτέ στην διάθεση των χρηστών μέσα σε λίγα μόνο δευτερόλεπτα. Ο αριθμός των χρηστών το 2019 στις ανεπτυγμένες χώρες ανέρχεται στους 81 ανά 100 πολίτες. Ενώ ο αριθμός αυτός μειώνεται στις αναπτυσσόμενες χώρες στους 41 ανά 100 πολίτες. Αυτή...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13149 |
id |
nemertes-10889-13149 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-131492022-09-05T20:35:52Z Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων Ραγκαβάνης, Γεράσιμος Μακρής, Χρήστος Χατζηλυγερούδης, Ιωάννης Ragkavanis, Gerasimos Ανάκτηση πληροφορίας Ανεστραμμένα αρχεία Python Data recovery Στην σύγχρονη εποχή το διαδίκτυο βρίσκεται πιο πολύ από ποτέ στην διάθεση των χρηστών μέσα σε λίγα μόνο δευτερόλεπτα. Ο αριθμός των χρηστών το 2019 στις ανεπτυγμένες χώρες ανέρχεται στους 81 ανά 100 πολίτες. Ενώ ο αριθμός αυτός μειώνεται στις αναπτυσσόμενες χώρες στους 41 ανά 100 πολίτες. Αυτή η επιτυχία βασίζεται στο γεγονός της επιτυχίας των μηχανών αναζήτησης να προβάλουν το περιεχόμενο που ενδιαφέρει τον χρήστη άμεσα και γρήγορα. Οι μηχανές αναζήτησης όμως για να μπορούν να λειτουργούν τόσο αποδοτικά τμηματοποιούνται σε πολλά επίπεδα γεγονός που επιτρέπει την βελτιστοποίηση του κάθε επιπέδου μεμονωμένα ή σε συνάρτηση με τα γειτονικά του. Το επίπεδο που αφορά την διπλωματική εργασία είναι η αποθήκευση μεγάλου όγκου δεδομένων. Ο τρόπος δηλαδή αποθήκευσης των κειμένων που έχουν δημοσιεύσει οι χρήστες. Αυτό επιτυγχάνεται κυρίως με ανεστραμμένα αρχεία, ένας συγκεκριμένος τύπος αρχείου που βοηθά στο ταίριασμα της αναζήτησης του χρήστη με δεδομένα που είναι αποθηκευμένα στις δομές δεδομένων της μηχανής αναζήτησης. Παρόλο που ο τύπος αυτός είναι ευρέως χρησιμοποιούμενος υπήρξαν και άλλες εναλλακτικές στο παρελθόν. Θα μελετήσουμε σε τι υπερισχύει το ανεστραμμένο αρχείο καθώς και τους αλγορίθμους συντήρησης των δομών που δημιουργούνται στην δευτερεύουσα μνήμη των συστημάτων. Τέλος θα προταθεί ένας παρεμφερής αλγόριθμος καθώς και τροποποίηση ενός εκ των αλγορίθμων που βασίστηκε η έρευνα που πραγματοποιήθηκε. In the modern age, internet is much more accessible than ever before in just a few seconds. The number of users in developed countries in 2019 is 81 per 100 citizens. While this number is declining in developing countries to 41 per 100 citizens. This success is based on the fact that search engines succeed in delivering content that interests the user instantly and quickly. But the search engines, in order to be able to function so efficiently, are segmented on several levels, which allows each level to be optimized individually or in relation to its neighbors. The thesis’s presented main subject is the techniques applied during storage of large volumes of data. Those data contain the texts that users have posted or the text that users seek to retrieve. This is mainly achieved with inverted files, a specific type of file that helps to match the user’s search with data stored in the search engine’s data structures. Although this type of file is widely used, there have been other alternatives in the past. We will study what characteristics made the inverted file stand out as well as the algorithms for maintaining/updating the structures create in the system’s secondary memory. Based on the research carried out a variation one of the basic algorithms presented will be suggested as well as a different technique of updating. 2020-02-06T21:30:18Z 2020-02-06T21:30:18Z 2019-11-13 Thesis http://hdl.handle.net/10889/13149 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ανάκτηση πληροφορίας Ανεστραμμένα αρχεία Python Data recovery |
spellingShingle |
Ανάκτηση πληροφορίας Ανεστραμμένα αρχεία Python Data recovery Ραγκαβάνης, Γεράσιμος Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
description |
Στην σύγχρονη εποχή το διαδίκτυο βρίσκεται πιο πολύ από ποτέ
στην διάθεση των χρηστών μέσα σε λίγα μόνο δευτερόλεπτα. Ο
αριθμός των χρηστών το 2019 στις ανεπτυγμένες χώρες ανέρχεται
στους 81 ανά 100 πολίτες. Ενώ ο αριθμός αυτός μειώνεται στις
αναπτυσσόμενες χώρες στους 41 ανά 100 πολίτες.
Αυτή η επιτυχία βασίζεται στο γεγονός της επιτυχίας των μηχανών
αναζήτησης να προβάλουν το περιεχόμενο που ενδιαφέρει τον χρήστη
άμεσα και γρήγορα. Οι μηχανές αναζήτησης όμως για να μπορούν να
λειτουργούν τόσο αποδοτικά τμηματοποιούνται σε πολλά επίπεδα
γεγονός που επιτρέπει την βελτιστοποίηση του κάθε επιπέδου
μεμονωμένα ή σε συνάρτηση με τα γειτονικά του.
Το επίπεδο που αφορά την διπλωματική εργασία είναι η αποθήκευση
μεγάλου όγκου δεδομένων. Ο τρόπος δηλαδή αποθήκευσης των
κειμένων που έχουν δημοσιεύσει οι χρήστες. Αυτό επιτυγχάνεται
κυρίως με ανεστραμμένα αρχεία, ένας συγκεκριμένος τύπος αρχείου
που βοηθά στο ταίριασμα της αναζήτησης του χρήστη με δεδομένα
που είναι αποθηκευμένα στις δομές δεδομένων της μηχανής
αναζήτησης.
Παρόλο που ο τύπος αυτός είναι ευρέως χρησιμοποιούμενος
υπήρξαν και άλλες εναλλακτικές στο παρελθόν. Θα μελετήσουμε σε τι
υπερισχύει το ανεστραμμένο αρχείο καθώς και τους αλγορίθμους
συντήρησης των δομών που δημιουργούνται στην δευτερεύουσα
μνήμη των συστημάτων.
Τέλος θα προταθεί ένας παρεμφερής αλγόριθμος καθώς και
τροποποίηση ενός εκ των αλγορίθμων που βασίστηκε η έρευνα που
πραγματοποιήθηκε. |
author2 |
Μακρής, Χρήστος |
author_facet |
Μακρής, Χρήστος Ραγκαβάνης, Γεράσιμος |
format |
Thesis |
author |
Ραγκαβάνης, Γεράσιμος |
author_sort |
Ραγκαβάνης, Γεράσιμος |
title |
Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
title_short |
Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
title_full |
Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
title_fullStr |
Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
title_full_unstemmed |
Μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
title_sort |
μελέτη αποδοτικών αλγόριθμων για δυναμική διαχείρηση ανεστραμμένων αρχείων |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13149 |
work_keys_str_mv |
AT rankabanēsgerasimos meletēapodotikōnalgorithmōngiadynamikēdiacheirēsēanestrammenōnarcheiōn |
_version_ |
1771297319268909056 |