Επεξεργασία και βελτιστοποίηση ερωτήσεων σε NoSQL βάσεις δεδομένων με χρήση έξυπνων ευρετηρίων

Ζούμε σε ένα κόσμο που κατακλύζεται από δεδομένα όπου και αν βρισκόμαστε. Από τοπικές επιχειρήσεις μέχρι εταιρικούς κολοσσούς, όλοι προσπαθούν και επενδύουν χρήματα και χρόνο για να επιτύχουν τον ίδιο στόχο, αποθήκευση και επεξεργασία δεδομένων. Το έργο αυτό δεν πρόκειται καθόλου για μια τετριμμένη...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σαμολαδάς, Δημήτριος
Άλλοι συγγραφείς: Σιούτας, Σπύρος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13169
Περιγραφή
Περίληψη:Ζούμε σε ένα κόσμο που κατακλύζεται από δεδομένα όπου και αν βρισκόμαστε. Από τοπικές επιχειρήσεις μέχρι εταιρικούς κολοσσούς, όλοι προσπαθούν και επενδύουν χρήματα και χρόνο για να επιτύχουν τον ίδιο στόχο, αποθήκευση και επεξεργασία δεδομένων. Το έργο αυτό δεν πρόκειται καθόλου για μια τετριμμένη διαδικασία. Ο όγκος και η πολυπλοκότητα των δεδομένων έχει αυξηθεί σε τέτοιο βαθμό που η δυνατότητα έξυπνης διαχείρισης τους αποτελεί πλέον ανάγκη σε αυτή την εποχή, την εποχή των Big Data. Η ανάγκη αυτή αρχικά οδήγησε σε όλο και μεγαλύτερη αποθηκευτική δύναμη μέχρι που φτάσαμε σε αδιέξοδο. Τότε, άρχισε να εξελίσσεται η έννοια της κατανομής δεδομένων και των κατανεμημένων συστημάτων. Έννοιες όπως το cloud εισήλθαν στο παιχνίδι προσφέροντας ένα ολοκληρωμένο σύστημα πόρων και εφαρμογών για την κατανομή και διαχείριση της πληροφορίας. Ακολούθησαν συστήματα όπως το Hadoop και η HBase που πήραν από τον χρήστη τον πονοκέφαλο της πολυπλοκότητας διαχείρισης και συντήρησης ενός κατανεμημένου συστήματος αποθήκευσης δεδομένων και του προσέφεραν πίσω τα εργαλεία που αυτός χρειάζεται για να τα διαχειριστεί. Οι επιχειρήσεις, έχοντας πλέον κατακτήσει το παιχνίδι της κατανομής δεδομένων, στοχεύουν πλέον στη γρήγορη και αποδοτική εξαγωγή χρήσιμης πληροφορίας από αυτά. Εργαλεία που προϋπήρχαν με σκοπό την επίτευξη αυτού του στόχου είναι τα ευρετήρια. Σε αυτή τη διπλωματική, θα παρουσιαστούν υπάρχουσες υλοποιήσεις τέτοιων ευρετηρίων σε κατανεμημένα περιβάλλοντα αλλά και μια δική μας υλοποίηση που βασίζεται στην δομή δεδομένων R-Tree. Η υλοποίηση μας εστιάζει σε χωρικά δεδομένα και ξεφεύγει από την παραδοσιακή κεντρικοποιημένη υλοποίηση μεταβαίνοντας στον κατανεμημένο κόσμο. Το ευρετήριο αυτό προσφέρει όπως θα δούμε αποδοτική αναζήτηση εύρους και κοντινότερων γειτόνων ενώ μπορεί να ανταπεξέλθει στον αυξανόμενο όγκο δεδομένων χωρίς να δυσχεραίνεται η απόδοση του με την χρήση της τεχνολογίας MapReduce του Hadoop για την κατασκευή του. Τέλος για την αποθήκευση του ευρετηρίου χρησιμοποιείται η NoSQL βάση δεδομένων HBase που μας επιτρέπει γρήγορα ερωτήματα και εισαγωγές, στοιχεία απαραίτητα για ένα αποδοτικό ευρετήριο.