Περίληψη: | Σκοπός της παρούσας διπλωματικής εργασίας είναι η ανάλυση μεγάλου όγκου δεδομένων με έμφαση στο πεδίο της ενέργειας. Τα δεδομένα που κατασκευάζονται εισάγονται στο λογισμικό Tableau και προκύπτουν τα τελικά αποτελέσματα συναθροίσεων των στατιστικών τους παραμέτρων και η οπτικοποίησή τους μέσω γραφημάτων. Η δομή και το περιεχόμενο της εργασίας αναλύονται ακολούθως. Στο πρώτο κεφάλαιο γίνεται εισαγωγή στα μεγάλου όγκου δεδομένα και επεξηγούνται οι εννοιολογικοί τους ορισμοί. Επιπλέον, αναλύονται οι επιθυμητές ιδιότητες ενός συστήματος μεγάλου όγκου δεδομένων. Στο δεύτερο κεφάλαιο παρουσιάζεται η αρχιτεκτονική Lambda και αναλύονται τα επίπεδα στα οποία αυτή διαχωρίζεται. Το τρίτο κεφάλαιο πραγματεύεται το μοντέλο δεδομένων για τα δεδομένα μεγάλου όγκου, ενώ παρέχονται πλήρεις εξηγήσεις για τη μορφή και τις ιδιότητες που τα χαρακτηρίζουν. Στη συνέχεια γίνεται εισαγωγή στην έννοια του σχηματικού διαγράμματος για την απεικόνιση των δεδομένων. Το τέταρτο κεφάλαιο αναφέρεται στο Hadoop, στην αρχιτεκτονική του και στις πιο θεμελιώδεις μονάδες που το συγκροτούν. Επιπροσθέτως, γίνεται ανάλυση του προγραμματιστικού μοντέλου MapReduce. Στο πέμπτο κεφάλαιο παρουσιάζεται η έννοια του διαδικτύου των αντικειμένων, καθώς και ο τρόπος συσχέτισής του με τα μεγάλου όγκου δεδομένα. Στο έκτο κεφάλαιο παρουσιάζεται η υλοποίηση, στα πλαίσια της οποίας υιοθετείται μια υπόθεση εργασίας και κατασκευάζεται ο αλγόριθμος της εφαρμογής των δεδομένων. Επίσης γίνεται επεξήγηση του λογισμικού Tableau, το οποίο χρησιμοποιείται για την ανάλυση των δεδομένων. Τέλος, στο έβδομο κεφάλαιο παρατίθενται τα τελικά αποτελέσματα της ανάλυσης των δεδομένων. Τα αποτελέσματα αφορούν τον υπολογισμό των στατιστικών παραμέτρων και την κατασκευή των γραφημάτων που τα περιγράφουν.
|