Περίληψη: | Το R(ectangle)-Tree είναι μία γενίκευση του Β+ Tree που αναπτύχθηκε για αποδοτικότερη και αποτελεσματικότερη επεξεργασία διατομικών ερωτημάτων σε χωρικές βάσεις δεδομένων. Τα R-Trees λειτουργούν αποθηκεύοντας την πληροφορία σε επίπεδα δισδιάστατων ορθογωνίων. Το R-Tree όταν αποτελείται από μικρό πλήθος εισαγωγών λειτουργεί σε ικανοποιητικούς χρόνους. Όταν όμως αποτελείται από εκατομμύρια ή δεκάδες εκατομμύρια δεδομένα παύει να είναι αποδοτικό .
Στο πλαίσιο αυτής της εργασίας, αρχικά, γίνεται ανάλυση της υλοποίησης της δομής δισδιάστατων δεδομένων R-Tree η οποία αναπτύχθηκε με τη χρήση της προγραμματιστικής γλώσσας Python και των βασικών αλγορίθμων που διέπουν αυτή την δομή καθώς και άλλων χωρικών ερωτημάτων. Έπειτα, με χρήση του εργαλείου Spark και ιδιαίτερα την βιβλιοθήκη PySpark που λειτουργεί ως διασύνδεση ανάμεσα στην Python και Spark, επιτυγχάνεται η υλοποίηση ενός κατανεμημένου (Distributed) R-Tree.
Χρησιμοποιώντας αυτή την νέα κατανεμημένη υλοποίηση του R-Tree, υλοποιείται πειραματική αξιολόγηση των υλοποιημένων αλγορίθμων με τροφοδότηση, αυξανόμενων σε μέγεθος, συνόλων δεδομένων στην κατανεμημένη υλοποίηση R-Tree.
|