Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων
Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13610 |
id |
nemertes-10889-13610 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-136102022-09-06T05:14:01Z Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων Data mining on internet of things Ζαχαροπούλου, Χρυσή Μεγαλοοικονόμου, Βασίλειος Μακρής, Χρήστος Zacharopoulos, Chrissie Διαδίκτυο των πραγμάτων Εξόρυξη δεδομένων Μοντέλα πρόβλεψης Internet of Things (IoT) Data mining Prediction models 006.312 Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά αποδοτικές λύσεις για την παρακολούθηση του περιβάλλοντος, ωστόσο είναι αρκετά ευάλωτοι. Καθόλη τη διάρκεια λειτουργίας τους, μπορούν να καταγραφούν αναξιόπιστα δεδομένα λόγω της επιρροής εξωτερικών αλλά και εσωτερικών παραγόντων όπως είναι για παράδειγμα η πτώση τάσης ή η υπερθέρμανσή τους. Ακραίες τιμές ή τιμές που λείπουν όμως τις περισσότερες φορές προκαλούν δυσκολίες σε διάφορες εφαρμογές. Εάν έχουν καταγραφεί αναξιόπιστα δεδομένα τότε είναι σίγουρο πως τα αποτελέσματα που θα εξαχθούν ύστερα από οποιαδήποτε ανάλυση πάνω σε αυτά θα είναι παραπλανητικά. Σε περιπτώσεις ασυρμάτων δικτύων αισθητήρων που συλλέγουν δεδομένα θερμοκρασίας, υγρασίας και άλλων τέτοιων περιβαλλοντικών μεταβλητών, ελλιπή δεδομένα προκαλούν πρόβλημα εφόσον πολλά από τα υπάρχοντα εργαλεία ανάλυσης δεν μπορούν να επεξεργαστούν δεδομένα στα οποία λείπουν τιμές. Συνεπώς, η συμπλήρωση αυτών των τιμών είναι σημαντική. Στα πλαίσια της διπλωματικής εργασίας, επιλέχθηκε ένα σύνολο δεδομένων το οποίο προέρχεται από ένα τέτοιο δίκτυο αισθητήρων και στο οποίο παρατηρούνται τα παραπάνω προβλήματα. Επομένως, πριν την εφαρμογή διαφόρων αλγορίθμων μηχανικής μάθησης πάνω σε αυτά τα δεδομένα, προηγήθηκε η προεπεξεργασία τους. Κατά το στάδιο της προεπεξεργασίας, αναπτύχθηκε αλγόριθμος ο οποίος συμπληρώνει τις τιμές που λείπουν αξιοποιώντας τόσο τη χωρική όσο και τη χρονική συσχέτιση των δεδομένων εφόσον πρόκειται για δεδομένα χρονοσειράς και κάθε αισθητήρας του συστήματος φέρει τις δικές του συντεταγμένες. Μετά την ολοκλήρωση της προεπεξεργασίας των δεδομένων, εφαρμόστηκαν διάφορα μοντέλα πρόβλεψης επιδιώκοντας την αξιολόγηση της αποτελεσματικότητας καθενός από αυτούς τους αλγορίθμους πρόβλεψης πάνω στα δεδομένα. The loss of data and the inaccuracy of several of the recorded values are events that occur frequently in wireless sensor networks due to the nature of the sensors that are part of such a system. Sensors that belong to such systems may offer economical and energy efficient solutions to monitor the environment, but they are quite vulnerable. Throughout their lifespan, unreliable data may be recorded due to the influence of external or internal factors, such as voltage dropping or overheating. Extreme or missing values, however, most often cause difficulties in various applications. If unreliable data is recorded then it is certain that the results that will be derived from any analysis on them will be misleading. In cases of wireless sensor networks that collect temperature, humidity and other environmental readings, missing data is a problem because many of the existing analysis tools can not process data that has missing values. Therefore, data imputation is an important task. In this thesis, a data set that derives from such a sensor network was selected. The problems mentioned above are observed in this data set. Therefore, before applying various machine learning algorithms on this data, preprocessing was required first. During the preprocessing stage, an algorithm was developed. This algorithm fills the missing values by utilizing both the spatial and temporal correlation of the data. After the preprocessing stage, various predictive algorithms were applied on the data so as to evaluate the efficiency of each algorithm and find the one that works best on this data set. 2020-07-13T09:12:35Z 2020-07-13T09:12:35Z 2019-05-23 Thesis http://hdl.handle.net/10889/13610 gr 12 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Διαδίκτυο των πραγμάτων Εξόρυξη δεδομένων Μοντέλα πρόβλεψης Internet of Things (IoT) Data mining Prediction models 006.312 |
spellingShingle |
Διαδίκτυο των πραγμάτων Εξόρυξη δεδομένων Μοντέλα πρόβλεψης Internet of Things (IoT) Data mining Prediction models 006.312 Ζαχαροπούλου, Χρυσή Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
description |
Η απώλεια δεδομένων καθώς και η ανακρίβεια αρκετών από τις τιμές που καταγράφονται αποτελούν γεγονότα που συμβαίνουν συχνά σε ασύρματα δίκτυα αισθητήρων εξαιτίας της φύσης των αισθητήρων που απαρτίζουν ένα τέτοιο σύστημα. Οι αισθητήρες τέτοιων συστημάτων ναι μεν προσφέρουν οικονομικά και ενεργειακά αποδοτικές λύσεις για την παρακολούθηση του περιβάλλοντος, ωστόσο είναι αρκετά ευάλωτοι. Καθόλη τη διάρκεια λειτουργίας τους, μπορούν να καταγραφούν αναξιόπιστα δεδομένα λόγω της επιρροής εξωτερικών αλλά και εσωτερικών παραγόντων όπως είναι για παράδειγμα η πτώση τάσης ή η υπερθέρμανσή τους. Ακραίες τιμές ή τιμές που λείπουν όμως τις περισσότερες φορές προκαλούν δυσκολίες σε διάφορες εφαρμογές. Εάν έχουν καταγραφεί αναξιόπιστα δεδομένα τότε είναι σίγουρο πως τα αποτελέσματα που θα εξαχθούν ύστερα από οποιαδήποτε ανάλυση πάνω σε αυτά θα είναι παραπλανητικά. Σε περιπτώσεις ασυρμάτων δικτύων αισθητήρων που συλλέγουν δεδομένα θερμοκρασίας, υγρασίας και άλλων τέτοιων περιβαλλοντικών μεταβλητών, ελλιπή δεδομένα προκαλούν πρόβλημα εφόσον πολλά από τα υπάρχοντα εργαλεία ανάλυσης δεν μπορούν να επεξεργαστούν δεδομένα στα οποία λείπουν τιμές. Συνεπώς, η συμπλήρωση αυτών των τιμών είναι σημαντική. Στα πλαίσια της διπλωματικής εργασίας, επιλέχθηκε ένα σύνολο δεδομένων το οποίο προέρχεται από ένα τέτοιο δίκτυο αισθητήρων και στο οποίο παρατηρούνται τα παραπάνω προβλήματα. Επομένως, πριν την εφαρμογή διαφόρων αλγορίθμων μηχανικής μάθησης πάνω σε αυτά τα δεδομένα, προηγήθηκε η προεπεξεργασία τους. Κατά το στάδιο της προεπεξεργασίας, αναπτύχθηκε αλγόριθμος ο οποίος συμπληρώνει τις τιμές που λείπουν αξιοποιώντας τόσο τη χωρική όσο και τη χρονική συσχέτιση των δεδομένων εφόσον πρόκειται για δεδομένα χρονοσειράς και κάθε αισθητήρας του συστήματος φέρει τις δικές του συντεταγμένες. Μετά την ολοκλήρωση της προεπεξεργασίας των δεδομένων, εφαρμόστηκαν διάφορα μοντέλα πρόβλεψης επιδιώκοντας την αξιολόγηση της αποτελεσματικότητας καθενός από αυτούς τους αλγορίθμους πρόβλεψης πάνω στα δεδομένα. |
author2 |
Μεγαλοοικονόμου, Βασίλειος |
author_facet |
Μεγαλοοικονόμου, Βασίλειος Ζαχαροπούλου, Χρυσή |
format |
Thesis |
author |
Ζαχαροπούλου, Χρυσή |
author_sort |
Ζαχαροπούλου, Χρυσή |
title |
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
title_short |
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
title_full |
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
title_fullStr |
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
title_full_unstemmed |
Εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
title_sort |
εξόρυξη δεδομένων στο διαδίκτυο των πραγμάτων |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13610 |
work_keys_str_mv |
AT zacharopoulouchrysē exoryxēdedomenōnstodiadiktyotōnpragmatōn AT zacharopoulouchrysē dataminingoninternetofthings |
_version_ |
1771297361567416320 |