Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων

Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ζαχαροπούλου, Χρυσή
Άλλοι συγγραφείς: Μεγαλοοικονόμου, Βασίλειος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13610
id nemertes-10889-13610
record_format dspace
spelling nemertes-10889-136102022-09-06T05:14:01Z Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων Data mining on internet of things Ζαχαροπούλου, Χρυσή Μεγαλοοικονόμου, Βασίλειος Μακρής, Χρήστος Zacharopoulos, Chrissie Διαδίκτυο των πραγμάτων Εξόρυξη δεδομένων Μοντέλα πρόβλεψης Internet of Things (IoT) Data mining Prediction models 006.312 Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά αποδοτικές λύσεις για την παρακολούθηση του περιβάλλοντος, ωστόσο είναι αρκετά ευάλωτοι. Καθόλη τη διάρκεια λειτουργίας τους, μπορούν να καταγραφούν αναξιόπιστα δεδομένα λόγω της επιρροής εξωτερικών αλλά και εσωτερικών παραγόντων όπως είναι για παράδειγμα η πτώση τάσης ή η υπερθέρμανσή τους. Ακραίες τιμές ή τιμές που λείπουν όμως τις περισσότερες φορές προκαλούν δυσκολίες σε διάφορες εφαρμογές. Εάν έχουν καταγραφεί αναξιόπιστα δεδομένα τότε είναι σίγουρο πως τα αποτελέσματα που θα εξαχθούν ύστερα από οποιαδήποτε ανάλυση πάνω σε αυτά θα είναι παραπλανητικά. Σε περιπτώσεις ασυρμάτων δικτύων αισθητήρων που συλλέγουν δεδομένα θερμοκρασίας, υγρασίας και άλλων τέτοιων περιβαλλοντικών μεταβλητών, ελλιπή δεδομένα προκαλούν πρόβλημα εφόσον πολλά από τα υπάρχοντα εργαλεία ανάλυσης δεν μπορούν να επεξεργαστούν δεδομένα στα οποία λείπουν τιμές. Συνεπώς, η συμπλήρωση αυτών των τιμών είναι σημαντική. Στα πλαίσια της διπλωματικής εργασίας, επιλέχθηκε ένα σύνολο δεδομένων το οποίο προέρχεται από ένα τέτοιο δίκτυο αισθητήρων και στο οποίο παρατηρούνται τα παραπάνω προβλήματα. Επομένως, πριν την εφαρμογή διαφόρων αλγορίθμων μηχανικής μάθησης πάνω σε αυτά τα δεδομένα, προηγήθηκε η προεπεξεργασία τους. Κατά το στάδιο της προεπεξεργασίας, αναπτύχθηκε αλγόριθμος ο οποίος συμπληρώνει τις τιμές που λείπουν αξιοποιώντας τόσο τη χωρική όσο και τη χρονική συσχέτιση των δεδομένων εφόσον πρόκειται για δεδομένα χρονοσειράς και κάθε αισθητήρας του συστήματος φέρει τις δικές του συντεταγμένες. Μετά την ολοκλήρωση της προεπεξεργασίας των δεδομένων, εφαρμόστηκαν διάφορα μοντέλα πρόβλεψης επιδιώκοντας την αξιολόγηση της αποτελεσματικότητας καθενός από αυτούς τους αλγορίθμους πρόβλεψης πάνω στα δεδομένα. The loss of data and the inaccuracy of several of the recorded values are events that occur frequently in wireless sensor networks due to the nature of the sensors that are part of such a system. Sensors that belong to such systems may offer economical and energy efficient solutions to monitor the environment, but they are quite vulnerable. Throughout their lifespan, unreliable data may be recorded due to the influence of external or internal factors, such as voltage dropping or overheating. Extreme or missing values, however, most often cause difficulties in various applications. If unreliable data is recorded then it is certain that the results that will be derived from any analysis on them will be misleading. In cases of wireless sensor networks that collect temperature, humidity and other environmental readings, missing data is a problem because many of the existing analysis tools can not process data that has missing values. Therefore, data imputation is an important task. In this thesis, a data set that derives from such a sensor network was selected. The problems mentioned above are observed in this data set. Therefore, before applying various machine learning algorithms on this data, preprocessing was required first. During the preprocessing stage, an algorithm was developed. This algorithm fills the missing values by utilizing both the spatial and temporal correlation of the data. After the preprocessing stage, various predictive algorithms were applied on the data so as to evaluate the efficiency of each algorithm and find the one that works best on this data set. 2020-07-13T09:12:35Z 2020-07-13T09:12:35Z 2019-05-23 Thesis http://hdl.handle.net/10889/13610 gr 12 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Διαδίκτυο των πραγμάτων
Εξόρυξη δεδομένων
Μοντέλα πρόβλεψης
Internet of Things (IoT)
Data mining
Prediction models
006.312
spellingShingle Διαδίκτυο των πραγμάτων
Εξόρυξη δεδομένων
Μοντέλα πρόβλεψης
Internet of Things (IoT)
Data mining
Prediction models
006.312
Ζαχαροπούλου, Χρυσή
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
description Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά αποδοτικές λύσεις για την παρακολούθηση του περιβάλλοντος, ωστόσο είναι αρκετά ευάλωτοι. Καθόλη τη διάρκεια λειτουργίας τους, μπορούν να καταγραφούν αναξιόπιστα δεδομένα λόγω της επιρροής εξωτερικών αλλά και εσωτερικών παραγόντων όπως είναι για παράδειγμα η πτώση τάσης ή η υπερθέρμανσή τους. Ακραίες τιμές ή τιμές που λείπουν όμως τις περισσότερες φορές προκαλούν δυσκολίες σε διάφορες εφαρμογές. Εάν έχουν καταγραφεί αναξιόπιστα δεδομένα τότε είναι σίγουρο πως τα αποτελέσματα που θα εξαχθούν ύστερα από οποιαδήποτε ανάλυση πάνω σε αυτά θα είναι παραπλανητικά. Σε περιπτώσεις ασυρμάτων δικτύων αισθητήρων που συλλέγουν δεδομένα θερμοκρασίας, υγρασίας και άλλων τέτοιων περιβαλλοντικών μεταβλητών, ελλιπή δεδομένα προκαλούν πρόβλημα εφόσον πολλά από τα υπάρχοντα εργαλεία ανάλυσης δεν μπορούν να επεξεργαστούν δεδομένα στα οποία λείπουν τιμές. Συνεπώς, η συμπλήρωση αυτών των τιμών είναι σημαντική. Στα πλαίσια της διπλωματικής εργασίας, επιλέχθηκε ένα σύνολο δεδομένων το οποίο προέρχεται από ένα τέτοιο δίκτυο αισθητήρων και στο οποίο παρατηρούνται τα παραπάνω προβλήματα. Επομένως, πριν την εφαρμογή διαφόρων αλγορίθμων μηχανικής μάθησης πάνω σε αυτά τα δεδομένα, προηγήθηκε η προεπεξεργασία τους. Κατά το στάδιο της προεπεξεργασίας, αναπτύχθηκε αλγόριθμος ο οποίος συμπληρώνει τις τιμές που λείπουν αξιοποιώντας τόσο τη χωρική όσο και τη χρονική συσχέτιση των δεδομένων εφόσον πρόκειται για δεδομένα χρονοσειράς και κάθε αισθητήρας του συστήματος φέρει τις δικές του συντεταγμένες. Μετά την ολοκλήρωση της προεπεξεργασίας των δεδομένων, εφαρμόστηκαν διάφορα μοντέλα πρόβλεψης επιδιώκοντας την αξιολόγηση της αποτελεσματικότητας καθενός από αυτούς τους αλγορίθμους πρόβλεψης πάνω στα δεδομένα.
author2 Μεγαλοοικονόμου, Βασίλειος
author_facet Μεγαλοοικονόμου, Βασίλειος
Ζαχαροπούλου, Χρυσή
format Thesis
author Ζαχαροπούλου, Χρυσή
author_sort Ζαχαροπούλου, Χρυσή
title Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
title_short Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
title_full Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
title_fullStr Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
title_full_unstemmed Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
title_sort εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
publishDate 2020
url http://hdl.handle.net/10889/13610
work_keys_str_mv AT zacharopoulouchrysē exoryxēdedomenōnstodiadiktyotōnpragmatōn
AT zacharopoulouchrysē dataminingoninternetofthings
_version_ 1771297361567416320