Υλοποίηση αποδοτικών δομών δεδομένων σε περιβάλλον Apache Spark

Το R-δέντρο είναι μια πολυδιάστατη δομή δεδομένων που παρουσιάστηκε από τον Guttman, Antonin το 1984, πρόκειται για μια δυναμική δομή δεικτοδότησης, είναι ένα ισοζυγισμένο δέντρο παρόμοιο με το B+ -δέντρο και χρησιμοποιείται για μεθόδους χωρικής αναζήτησης. Το συγκεκριμένο δέντρο εκφράζει κάθε κόμβο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κωνσταντόπουλος, Νικόλαος
Άλλοι συγγραφείς: Konstantopoulos, Nikolaos
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/24594
Περιγραφή
Περίληψη:Το R-δέντρο είναι μια πολυδιάστατη δομή δεδομένων που παρουσιάστηκε από τον Guttman, Antonin το 1984, πρόκειται για μια δυναμική δομή δεικτοδότησης, είναι ένα ισοζυγισμένο δέντρο παρόμοιο με το B+ -δέντρο και χρησιμοποιείται για μεθόδους χωρικής αναζήτησης. Το συγκεκριμένο δέντρο εκφράζει κάθε κόμβο του από μια περιοχή, η οποία ορίζεται από ένα ορθογώνιο ελαχίστου ορίου εκτός απο τα φύλλα του, που περιέχουν τις πλειάδες των σημείων που βρίσκονται εντός του αντίστοιχου ορίου. Στην παρούσα εργασία υλοποιείται η συγκεκριμένη πολυδιάστατη δομή, μαζί με τις βασικές λειτουργίες της, την κατασκευή, την εισαγωγή και την αναζήτηση εύρους, μαζί με την κατασκευή κορυφογραμμής και αναζήτη- σης εύρους εντός της κορυφογραμμής. Η υλοποίηση έγινε για κεντρικοποιημένο περιβάλλον αλλά και για κατανεμημένο, στο περιβάλλον της Apache Spark. Στόχος της εργασίας είναι να υποστηρίζονται όλες οι λειτουργίες του δέντρου στο περιβάλλον της Spark, να συγκρίνει τις δύο υλοποιήσεις και τελικά να εξάγει συμπεράσματα για τις προοπτικές που υπάρχουν για αξιοποίηση της κατανεμημένης υλοποίησης σε μεγάλα δεδομένα. Τέλος, αξιοποιείται και η τεχνολογία της κιβωτιοποίησης μέσω του λογισμικού εργαλείου Docker ώστε να υπάρχει μια εικονική συστάδα και να εξασφαλίζεται η αξιοπιστία της υλοποίησης και η δυνατότητα της για επέκταση σε πραγματική συστάδα υπολογιστών.