Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών

Στη σημερινή εποχή, που υπάρχει κάθε άλλο από έλλειψη δεδομένων, η αποτελεσματική διαχείριση και επεξεργασία τους για την παραγωγή χρήσιμων πληροφοριών διαδραματίζει πολύ σημαντικό ρόλο. Τα δεδομένα πλέον είναι «μεγάλου όγκου», που σημαίνει ότι δημιουργούνται τεράστιες ποσότητες δομημένων ή αδόμ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ντεμίρη, Νικολέτα
Άλλοι συγγραφείς: Ntemiri, Nikoleta
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15805
id nemertes-10889-15805
record_format dspace
spelling nemertes-10889-158052022-09-05T13:56:47Z Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών Big data engines evaluation Ντεμίρη, Νικολέτα Ntemiri, Nikoleta Μεγάλα δεδομένα Ροές δεδομένων Big data Spark Streaming Στη σημερινή εποχή, που υπάρχει κάθε άλλο από έλλειψη δεδομένων, η αποτελεσματική διαχείριση και επεξεργασία τους για την παραγωγή χρήσιμων πληροφοριών διαδραματίζει πολύ σημαντικό ρόλο. Τα δεδομένα πλέον είναι «μεγάλου όγκου», που σημαίνει ότι δημιουργούνται τεράστιες ποσότητες δομημένων ή αδόμητων δεδομένων μέσα σε ελάχιστο χρόνο, και τα οποία για να παραγάγουν χρήσιμη πληροφορία, πρέπει να τεθούν υπό επεξεργασία. Πολλές φορές τα δεδομένα «ρέουν» και έτσι η επεξεργασία τους είναι απαραίτητο να γίνει σε «πραγματικό» ή «σχεδόν πραγματικό» χρόνο. Αυτές οι «ροές» δεδομένων κερδίζουν όλο και περισσότερο το ενδιαφέρον, λόγω της εφαρμογής τους σε ένα ευρύτατο φάσμα σεναρίων. Για την εξυπηρέτηση των ραγδαίων απαιτήσεων επεξεργασίας ροών δεδομένων, έχουν αναπτυχθεί πολλές μηχανές υπολογισμού. Επίσης, στο παρελθόν έχουν αναπτυχθεί αξιολογήσεις σύγκρισης επιδόσεων μεταξύ κάποιων τέτοιων μηχανών σε «πραγματικές» συνθήκες. Οι αξιολογήσεις αυτές χρησιμεύουν για την επιλογή της καταλληλότερης πλατφόρμας για την εξυπηρέτηση των αναγκών της εκάστοτε εφαρμογής ροών σε πραγματικό χρόνο. Μεταξύ αυτών έχουν γίνει συγκρίσεις και για το Spark Streaming με άλλες μηχανές ροών δεδομένων. Ωστόσο, πρόσφατα ήρθε στην κυκλοφορία η έκδοση 3.0 του Spark, η 3.0.0. Καθώς λοιπόν δεν υπάρχουν αξιολογήσεις σύγκρισης επιδόσεων για ροές δεδομένων με τη νέα αυτή έκδοση του Spark, στην παρούσα διπλωματική μελετάται και αναπτύσσεται αυτή η αξιολόγηση. Με βάση τα πειράματα που διεξάγονται στην παρούσα μεταπτυχιακή διπλωματική εργασία, διενεργείται και η σύγκριση της απόδοσης των μηχανών ροών δεδομένων για διάφορα σενάρια. 2022-02-21T06:15:22Z 2022-02-21T06:15:22Z 2021-11-22 http://hdl.handle.net/10889/15805 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μεγάλα δεδομένα
Ροές δεδομένων
Big data
Spark Streaming
spellingShingle Μεγάλα δεδομένα
Ροές δεδομένων
Big data
Spark Streaming
Ντεμίρη, Νικολέτα
Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
description Στη σημερινή εποχή, που υπάρχει κάθε άλλο από έλλειψη δεδομένων, η αποτελεσματική διαχείριση και επεξεργασία τους για την παραγωγή χρήσιμων πληροφοριών διαδραματίζει πολύ σημαντικό ρόλο. Τα δεδομένα πλέον είναι «μεγάλου όγκου», που σημαίνει ότι δημιουργούνται τεράστιες ποσότητες δομημένων ή αδόμητων δεδομένων μέσα σε ελάχιστο χρόνο, και τα οποία για να παραγάγουν χρήσιμη πληροφορία, πρέπει να τεθούν υπό επεξεργασία. Πολλές φορές τα δεδομένα «ρέουν» και έτσι η επεξεργασία τους είναι απαραίτητο να γίνει σε «πραγματικό» ή «σχεδόν πραγματικό» χρόνο. Αυτές οι «ροές» δεδομένων κερδίζουν όλο και περισσότερο το ενδιαφέρον, λόγω της εφαρμογής τους σε ένα ευρύτατο φάσμα σεναρίων. Για την εξυπηρέτηση των ραγδαίων απαιτήσεων επεξεργασίας ροών δεδομένων, έχουν αναπτυχθεί πολλές μηχανές υπολογισμού. Επίσης, στο παρελθόν έχουν αναπτυχθεί αξιολογήσεις σύγκρισης επιδόσεων μεταξύ κάποιων τέτοιων μηχανών σε «πραγματικές» συνθήκες. Οι αξιολογήσεις αυτές χρησιμεύουν για την επιλογή της καταλληλότερης πλατφόρμας για την εξυπηρέτηση των αναγκών της εκάστοτε εφαρμογής ροών σε πραγματικό χρόνο. Μεταξύ αυτών έχουν γίνει συγκρίσεις και για το Spark Streaming με άλλες μηχανές ροών δεδομένων. Ωστόσο, πρόσφατα ήρθε στην κυκλοφορία η έκδοση 3.0 του Spark, η 3.0.0. Καθώς λοιπόν δεν υπάρχουν αξιολογήσεις σύγκρισης επιδόσεων για ροές δεδομένων με τη νέα αυτή έκδοση του Spark, στην παρούσα διπλωματική μελετάται και αναπτύσσεται αυτή η αξιολόγηση. Με βάση τα πειράματα που διεξάγονται στην παρούσα μεταπτυχιακή διπλωματική εργασία, διενεργείται και η σύγκριση της απόδοσης των μηχανών ροών δεδομένων για διάφορα σενάρια.
author2 Ntemiri, Nikoleta
author_facet Ntemiri, Nikoleta
Ντεμίρη, Νικολέτα
author Ντεμίρη, Νικολέτα
author_sort Ντεμίρη, Νικολέτα
title Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
title_short Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
title_full Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
title_fullStr Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
title_full_unstemmed Αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
title_sort αξιολόγηση μηχανών επεξεργασίας μεγάλου όγκου δεδομένων μέσω εφαρμογών
publishDate 2022
url http://hdl.handle.net/10889/15805
work_keys_str_mv AT ntemirēnikoleta axiologēsēmēchanōnepexergasiasmegalouonkoudedomenōnmesōepharmogōn
AT ntemirēnikoleta bigdataenginesevaluation
_version_ 1771297240962301952