Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων

Η ραγδαία ανάπτυξη της τεχνολογίας στον τομέα των κοινωνικών δικτύων και των έξυπνων κινητών συσκευών, σε συνδυασμό με τον μεγάλο αριθμό χρηστών, έχει σαν αποτέλεσμα την αύξηση του όγκου των ψηφιακών δεδομένων. Εκτός από το διαδίκτυο υπάρχουν και άλλες σημαντικές πηγές μεγάλου όγκου δεδομένων, όπως...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Γκορίτσας, Βασίλειος
Άλλοι συγγραφείς: Σούτας, Σπυρίδων
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2019
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/12645
id nemertes-10889-12645
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Ανωνυμία
Ερωτήματα κΝΝ
Ασφάλεια
Βάσεις μεγάλου όγκου δεδομένων
Anonymity
Queries kNN
Security
Big data database
spellingShingle Ανωνυμία
Ερωτήματα κΝΝ
Ασφάλεια
Βάσεις μεγάλου όγκου δεδομένων
Anonymity
Queries kNN
Security
Big data database
Γκορίτσας, Βασίλειος
Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
description Η ραγδαία ανάπτυξη της τεχνολογίας στον τομέα των κοινωνικών δικτύων και των έξυπνων κινητών συσκευών, σε συνδυασμό με τον μεγάλο αριθμό χρηστών, έχει σαν αποτέλεσμα την αύξηση του όγκου των ψηφιακών δεδομένων. Εκτός από το διαδίκτυο υπάρχουν και άλλες σημαντικές πηγές μεγάλου όγκου δεδομένων, όπως επιστημονικά, τηλεπικοινωνιακά, τραπεζικά, επιχειρηματικά δεδομένα, των οποίων η ανάλυση και διαχείριση είναι σημαντική για τη λήψη κρίσιμων αποφάσεων. Ο μεγάλος όγκος δεδομένων (Big Data) εγείρει ζητήματα που σχετίζονται όχι μόνο με τον τρόπο αποθήκευσης, επεξεργασίας και ανάκτησης τους αλλά και διατήρησης της ασφάλειας και ιδιωτικότητάς τους έναντι επιθέσεων. Τα σύγχρονα συστήματα βάσεων δεδομένων ασχολούνται συχνά με τη διαχείριση μεγάλου όγκου χωρικών δεδομένων τα οποία συνδέονται με τη θέση ενός κινούμενου χρήστη ο οποίος δίνει πληροφορίες για τη θέση του μέσω κατάλληλης εφαρμογής που τρέχει στην έξυπνη κινητή συσκευή του. Τα δεδομένα αυτά αποθηκεύονται σε μία βάση δεδομένων την οποία διαχειρίζεται ένας Location-based Service Provider. Οι παραδοσιακές μέθοδοι κρυπτογράφησης που στοχεύουν στην παροχή προστασίας συχνά δεν επαρκούν επειδή δεν υποστηρίζουν την εκτέλεση ερωτημάτων σε κρυπτογραφημένα δεδομένα. Σε αυτή την εργασία θα συζητήσουμε στο Κεφ.1 την έννοια και τα είδη των Βάσεων Δεδομένων καθώς και τις απαιτήσεις ασφαλείας. Στη συνέχεια, στο Κεφ. 2 θα παρουσιαστεί το γενικό πρόβλημα ασφαλούς υπολογισμού σε κρυπτογραφημένη βάση δεδομένων και θα παρουσιάσουμε τις κυριότερες κρυπτογραφικές αρχές οι οποίες μπορούν να διαμορφώσουν μία σθεναρή ασφαλή προσέγγιση στο πρόβλημα του υπολογισμού των k-πλησιέστερων γειτόνων (knn) σε μια κρυπτογραφημένη βάση δεδομένων και των επιθέσεων κακόβουλων χρηστών. Στο Κεφ. 3 θα παρουσιάσουμε ένα ενδιαφέρον μοντέλο ως εφαρμογή των τεχνικών που παρουσιάστηκαν στο Κεφ. 2 με σκοπό τη διατύπωση ασφαλών k-πλησιέστερων γειτόνων ερωτήματα. Επιπλέον, στο Κεφ. 4 γίνεται συζήτηση πάνω στα Μεγάλου Όγκου Δεδομένα και τα Περιβάλλοντα Διαχείρισής τους. Τέλος, στην παρούσα διπλωματική εκτελούνται ερωτήματα σε πραγματικά δεδομένα (αρχείο .csv) που αφορούν τις τροχιές ποδηλατών, τις ταχύτητες και γωνίες αυτών καθώς και τις χρονικές στιγμές τους. Με την βοήθεια των δομών του Spark, RDDs και Dataframes θα επεξεργαστούμε αυτά τα δεδομένα. Τα SQL ερωτήματα (queries) εκτελούνται στο περιβάλλον ανάπτυξης IntelliJ IDEA με την χρήση του Spark και SparkSQL και την γλώσσα προγραμματισμού Scala. Με την βοήθεια του Spark UI (web application), την εφαρμογή που δημιουργεί διεπαφή σε κάποιον φυλλομετρητή, θα παρατηρήσουμε τις δουλειές (jobs), τα στάδια (stages), τον χώρο (storage), το περιβάλλον του συστήματος (enviroment), τους εκτελεστές (executors) και τους χρόνους εκτέλεσης των ερωτημάτων.Τέλος εφαρμόζεται η τεχνική των k-πλησιέστερων γειτόνων μέσω των sql ερωτημάτων.
author2 Σούτας, Σπυρίδων
author_facet Σούτας, Σπυρίδων
Γκορίτσας, Βασίλειος
format Thesis
author Γκορίτσας, Βασίλειος
author_sort Γκορίτσας, Βασίλειος
title Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
title_short Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
title_full Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
title_fullStr Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
title_full_unstemmed Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
title_sort μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
publishDate 2019
url http://hdl.handle.net/10889/12645
work_keys_str_mv AT nkoritsasbasileios meletēkryptographikōntechnikōngiatēdiatypōsēasphalōnerōtēmatōnsemiabasēmegalouonkoudedomenōn
AT nkoritsasbasileios cryptographictechniquesforsecurequeriesinbigdatadatabase
_version_ 1771297285438701568
spelling nemertes-10889-126452022-09-05T20:21:17Z Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων Cryptographic techniques for secure queries in big data database Γκορίτσας, Βασίλειος Σούτας, Σπυρίδων Μακρής, Χρήστος Σιούτας, Σπυρίδων Gkoritsas, Vasileios Ανωνυμία Ερωτήματα κΝΝ Ασφάλεια Βάσεις μεγάλου όγκου δεδομένων Anonymity Queries kNN Security Big data database Η ραγδαία ανάπτυξη της τεχνολογίας στον τομέα των κοινωνικών δικτύων και των έξυπνων κινητών συσκευών, σε συνδυασμό με τον μεγάλο αριθμό χρηστών, έχει σαν αποτέλεσμα την αύξηση του όγκου των ψηφιακών δεδομένων. Εκτός από το διαδίκτυο υπάρχουν και άλλες σημαντικές πηγές μεγάλου όγκου δεδομένων, όπως επιστημονικά, τηλεπικοινωνιακά, τραπεζικά, επιχειρηματικά δεδομένα, των οποίων η ανάλυση και διαχείριση είναι σημαντική για τη λήψη κρίσιμων αποφάσεων. Ο μεγάλος όγκος δεδομένων (Big Data) εγείρει ζητήματα που σχετίζονται όχι μόνο με τον τρόπο αποθήκευσης, επεξεργασίας και ανάκτησης τους αλλά και διατήρησης της ασφάλειας και ιδιωτικότητάς τους έναντι επιθέσεων. Τα σύγχρονα συστήματα βάσεων δεδομένων ασχολούνται συχνά με τη διαχείριση μεγάλου όγκου χωρικών δεδομένων τα οποία συνδέονται με τη θέση ενός κινούμενου χρήστη ο οποίος δίνει πληροφορίες για τη θέση του μέσω κατάλληλης εφαρμογής που τρέχει στην έξυπνη κινητή συσκευή του. Τα δεδομένα αυτά αποθηκεύονται σε μία βάση δεδομένων την οποία διαχειρίζεται ένας Location-based Service Provider. Οι παραδοσιακές μέθοδοι κρυπτογράφησης που στοχεύουν στην παροχή προστασίας συχνά δεν επαρκούν επειδή δεν υποστηρίζουν την εκτέλεση ερωτημάτων σε κρυπτογραφημένα δεδομένα. Σε αυτή την εργασία θα συζητήσουμε στο Κεφ.1 την έννοια και τα είδη των Βάσεων Δεδομένων καθώς και τις απαιτήσεις ασφαλείας. Στη συνέχεια, στο Κεφ. 2 θα παρουσιαστεί το γενικό πρόβλημα ασφαλούς υπολογισμού σε κρυπτογραφημένη βάση δεδομένων και θα παρουσιάσουμε τις κυριότερες κρυπτογραφικές αρχές οι οποίες μπορούν να διαμορφώσουν μία σθεναρή ασφαλή προσέγγιση στο πρόβλημα του υπολογισμού των k-πλησιέστερων γειτόνων (knn) σε μια κρυπτογραφημένη βάση δεδομένων και των επιθέσεων κακόβουλων χρηστών. Στο Κεφ. 3 θα παρουσιάσουμε ένα ενδιαφέρον μοντέλο ως εφαρμογή των τεχνικών που παρουσιάστηκαν στο Κεφ. 2 με σκοπό τη διατύπωση ασφαλών k-πλησιέστερων γειτόνων ερωτήματα. Επιπλέον, στο Κεφ. 4 γίνεται συζήτηση πάνω στα Μεγάλου Όγκου Δεδομένα και τα Περιβάλλοντα Διαχείρισής τους. Τέλος, στην παρούσα διπλωματική εκτελούνται ερωτήματα σε πραγματικά δεδομένα (αρχείο .csv) που αφορούν τις τροχιές ποδηλατών, τις ταχύτητες και γωνίες αυτών καθώς και τις χρονικές στιγμές τους. Με την βοήθεια των δομών του Spark, RDDs και Dataframes θα επεξεργαστούμε αυτά τα δεδομένα. Τα SQL ερωτήματα (queries) εκτελούνται στο περιβάλλον ανάπτυξης IntelliJ IDEA με την χρήση του Spark και SparkSQL και την γλώσσα προγραμματισμού Scala. Με την βοήθεια του Spark UI (web application), την εφαρμογή που δημιουργεί διεπαφή σε κάποιον φυλλομετρητή, θα παρατηρήσουμε τις δουλειές (jobs), τα στάδια (stages), τον χώρο (storage), το περιβάλλον του συστήματος (enviroment), τους εκτελεστές (executors) και τους χρόνους εκτέλεσης των ερωτημάτων.Τέλος εφαρμόζεται η τεχνική των k-πλησιέστερων γειτόνων μέσω των sql ερωτημάτων. The rapid development of social networking technology and smart mobile devices, coupled with a large number of users, has resulted in an increase in the volume of digital data. Apart from the internet, there are other important sources of large amounts of data, such as scientific, telecommunication, banking, business data, whose analysis and management are important for making critical decisions. The large amount of data creates problems that are related not only to storage, processing and recovery, but also to protecting their security and privacy against attacks. Modern database systems often deal with the management of large volumes of spatial data that are linked to the location of a mobile user who provides location information through an appropriate application running on its intelligent mobile equipment. This data is stored in a database managed by a location-based service provider. Traditional encryption methods aimed at providing protection are often inadequate because they do not support the execution of queries in encrypted data. In this paper will be discussed in Chapter 1 the concept and types of databases as well as the security requirements. Next, in Chapter 2, we will present the general problem of safe calculation in an encrypted database and will present the main cryptographic principles that can form a solid secure approach to the problem of calculating the closest neighbors (knn) in an encrypted database and the attacks by malicious users. In Chapter 3 we will present an interesting model as an application of the techniques presented in Chapter 2 for the purpose of formulating safe and closer neighboring questions. In addition, Chapter 4 discusses Big Data and their Management Environments. Finally, in this diplomatic execution of queries on actual data (.csv file) relating to bicycle wheels, their speeds and their extremes and their timing. With the help of Spark structures, RDDs and Data will process this data. SQL queries (queries) are executed in the IntelliJ IDEA development environment using Spark and SparkSQL and the language Scala programming. With the help of Spark UI (web application), the application that creates interface to a browser, we will observe the jobs, the stages, the storage, the environment, the performers (executors) and query execution times. Finally, the technique of k-nearest neighbors is applied through sql queries. 2019-10-12T17:31:38Z 2019-10-12T17:31:38Z 2019-07-05 Thesis http://hdl.handle.net/10889/12645 gr 0 application/pdf