Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων

Σε αυτή την εργασία διερευνάται η χρήση διαφόρων μεθόδων Μηχανικής Μάθησης (Machine Learning) και συγκεκριμένα Βαθιάς Μάθησης(Deep Learning), για την ανίχνευση ανωμαλιών σε δεδομένα που καταγράφονται υπό τη μορφή χρονοσειρών. Στη σύγχρονη εποχή παρατηρείται καταιγισμός πληροφοριών από διάφορες πηγές...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ζούλφος, Αθανάσιος
Άλλοι συγγραφείς: Zoulfos, Athanasios
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/23746
id nemertes-10889-23746
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Μηχανική μάθηση
Τεχνητά νευρωνικά δίκτυα
Αναδρομικά νευρωνικά δίκτυα
Μακρά βραχυπρόθεσμη μνήμη
Αυτοκωδικοποιητές
Παραλλαγμένοι αυτοκωδικοποιητές
Γεννητικά ανταγωνιστικά δίκτυα
Machine learning
Artificial neural networks
Recurrent neural networks
Long short-term memory
Autoencoders
Variational autoencoders
Generative adversarial networks
spellingShingle Μηχανική μάθηση
Τεχνητά νευρωνικά δίκτυα
Αναδρομικά νευρωνικά δίκτυα
Μακρά βραχυπρόθεσμη μνήμη
Αυτοκωδικοποιητές
Παραλλαγμένοι αυτοκωδικοποιητές
Γεννητικά ανταγωνιστικά δίκτυα
Machine learning
Artificial neural networks
Recurrent neural networks
Long short-term memory
Autoencoders
Variational autoencoders
Generative adversarial networks
Ζούλφος, Αθανάσιος
Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
description Σε αυτή την εργασία διερευνάται η χρήση διαφόρων μεθόδων Μηχανικής Μάθησης (Machine Learning) και συγκεκριμένα Βαθιάς Μάθησης(Deep Learning), για την ανίχνευση ανωμαλιών σε δεδομένα που καταγράφονται υπό τη μορφή χρονοσειρών. Στη σύγχρονη εποχή παρατηρείται καταιγισμός πληροφοριών από διάφορες πηγές, που προσφέρουν δεδομένα με τη μορφή χρονοσειρών. Η επεξεργασία και κατανόηση των δεδομένων αυτών αποδεικνύεται κρίσιμης σημασίας ως προς τη διαχείριση συστημάτων και τη λήψη αποφάσεων. Πέρα από την κλασική περίπτωση της πρόβλεψης μελλοντικών τιμών, ένα ακόμα καίριο ζήτημα που προκύπτει, είναι η δυνατότητα να εντοπιστούν σημεία ή ακολουθίες σημείων που παρουσιάζουν μη φυσιολογική συμπεριφορά σε σχέση με την υπόλοιπη χρονοσειρά. Οι απρόσμενες τιμές που παρατηρούνται στα σημεία αυτά, μπορεί να υποδεικνύουν την ύπαρξη κάποιας μη επιθυμητής κατάστασης και να απαιτούν την ανάληψη ενεργειών απο τους υπεύθυνους. Πλέον, όμως, ο όγκος της πληροφορίας είναι πολύ μεγάλος και δύσκολα διαχειρίσιμος μόνο από τον ανθρώπινο παράγοντα. ́Ετσι, κερδίζουν συνεχώς έδαφος τεχνικές όπου η παρέμβασή του περιορίζεται σε ένα τελικό στάδιο και αφού η επισήμανση των πιθανά προβληματικών δεδομένων έχει πραγματοποιηθεί από κάποιο κατάλληλο υπολογιστικό σύστημα. Και προφανώς ως κλάδος αιχμής με πληθώρα επιτυχών εφαρμογών σε διάφορους τομείς, η Βαθιά Μάθηση(Deep Learning) έρχεται να διαδραματίσει και αυτή το δικό της σημαντικό ρόλο στην ανάπτυξη τέτοιων συστημάτων. Εστιάζοντας, λοιπόν, σε δεδομένα χρονοσειρών που οι τιμές τους, σε ορισμένα σημεία, εμφανίζουν κάποια μη αποδεκτή διακύμανση, γίνεται εφαρμογή τεσσάρων(4) μοντέλων Τεχνητών Νευρωνικών Δικτύων(Artificial Neural Networks) για τον εντοπισμό των συγκεκριμένων ανωμαλιών. Τα μοντέλα αυτά ανταποκρίνονται στις κυρίαρχες τάσεις που επικρατούν στη διεθνή βιβλιογραφία. Σε όλα κυριαρχούν οι Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης (Long Short-term Memory Units), που είναι οι πλέον κατάλληλες για την επεξεργασία δεδομένων που υπόκεινται σε κάποια χρονική ακολουθία. Γίνεται υλοποίηση ενός απλού Αναδρομικού Νευρωνικού Δικτύου με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Recurrent Neural Network), ενός Αυτοκωδικοποιητή με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Autoencoder), ενός Παραλλαγμένου Αυτοκωδικοποιητή(Variational Autoencoder) και ενός Γεννητικού Ανταγωνιστικού Δικτύου(Generative Adversarial Network), για την εκμάθηση του αναμενόμενου προτύπου εξέλιξης της χρονοσειράς. Στη συνέχεια, με την επιλογή ενός κατάλληλου Κατωφλιού(Threshold), επισημαίνονται τα σημεία που υπάρχει μεγάλη πιθανότητα να προκύπτει κάποια μη κανονική συμπεριφορά. Γίνεται εφαρμογή τους σε μια γκάμα δεδομένων, που καλύπτουν αρκετές περιπτώσεις, τόσο ως προς την πηγή τους, όσο και ως προς την ποιοτική διαχείρισή τους. Επιπλέον, πραγματοποιείται χρήση διαφόρων τεχνικών προεπεξεργασίας και αναπαράστασης των προαναφερθέντων δεδομένων, καθώς και οπτικοποίηση της πορείας εκπαίδευσης των μοντέλων και σύγκριση των αποτελεσμάτων τους.
author2 Zoulfos, Athanasios
author_facet Zoulfos, Athanasios
Ζούλφος, Αθανάσιος
author Ζούλφος, Αθανάσιος
author_sort Ζούλφος, Αθανάσιος
title Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
title_short Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
title_full Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
title_fullStr Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
title_full_unstemmed Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
title_sort ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων
publishDate 2022
url https://hdl.handle.net/10889/23746
work_keys_str_mv AT zoulphosathanasios anichneusēanōmaliōnsededomenachronoseirōnmechrēsētechnētōnneurōnikōndiktyōn
AT zoulphosathanasios anomalydetectionintimeseriesdatausingartificialneuralnetworks
_version_ 1771297158254821376
spelling nemertes-10889-237462022-11-08T04:35:05Z Ανίχνευση ανωμαλιών σε δεδομένα χρονοσειρών με χρήση τεχνητών νευρωνικών δικτύων Anomaly detection in time series data using artificial neural networks Ζούλφος, Αθανάσιος Zoulfos, Athanasios Μηχανική μάθηση Τεχνητά νευρωνικά δίκτυα Αναδρομικά νευρωνικά δίκτυα Μακρά βραχυπρόθεσμη μνήμη Αυτοκωδικοποιητές Παραλλαγμένοι αυτοκωδικοποιητές Γεννητικά ανταγωνιστικά δίκτυα Machine learning Artificial neural networks Recurrent neural networks Long short-term memory Autoencoders Variational autoencoders Generative adversarial networks Σε αυτή την εργασία διερευνάται η χρήση διαφόρων μεθόδων Μηχανικής Μάθησης (Machine Learning) και συγκεκριμένα Βαθιάς Μάθησης(Deep Learning), για την ανίχνευση ανωμαλιών σε δεδομένα που καταγράφονται υπό τη μορφή χρονοσειρών. Στη σύγχρονη εποχή παρατηρείται καταιγισμός πληροφοριών από διάφορες πηγές, που προσφέρουν δεδομένα με τη μορφή χρονοσειρών. Η επεξεργασία και κατανόηση των δεδομένων αυτών αποδεικνύεται κρίσιμης σημασίας ως προς τη διαχείριση συστημάτων και τη λήψη αποφάσεων. Πέρα από την κλασική περίπτωση της πρόβλεψης μελλοντικών τιμών, ένα ακόμα καίριο ζήτημα που προκύπτει, είναι η δυνατότητα να εντοπιστούν σημεία ή ακολουθίες σημείων που παρουσιάζουν μη φυσιολογική συμπεριφορά σε σχέση με την υπόλοιπη χρονοσειρά. Οι απρόσμενες τιμές που παρατηρούνται στα σημεία αυτά, μπορεί να υποδεικνύουν την ύπαρξη κάποιας μη επιθυμητής κατάστασης και να απαιτούν την ανάληψη ενεργειών απο τους υπεύθυνους. Πλέον, όμως, ο όγκος της πληροφορίας είναι πολύ μεγάλος και δύσκολα διαχειρίσιμος μόνο από τον ανθρώπινο παράγοντα. ́Ετσι, κερδίζουν συνεχώς έδαφος τεχνικές όπου η παρέμβασή του περιορίζεται σε ένα τελικό στάδιο και αφού η επισήμανση των πιθανά προβληματικών δεδομένων έχει πραγματοποιηθεί από κάποιο κατάλληλο υπολογιστικό σύστημα. Και προφανώς ως κλάδος αιχμής με πληθώρα επιτυχών εφαρμογών σε διάφορους τομείς, η Βαθιά Μάθηση(Deep Learning) έρχεται να διαδραματίσει και αυτή το δικό της σημαντικό ρόλο στην ανάπτυξη τέτοιων συστημάτων. Εστιάζοντας, λοιπόν, σε δεδομένα χρονοσειρών που οι τιμές τους, σε ορισμένα σημεία, εμφανίζουν κάποια μη αποδεκτή διακύμανση, γίνεται εφαρμογή τεσσάρων(4) μοντέλων Τεχνητών Νευρωνικών Δικτύων(Artificial Neural Networks) για τον εντοπισμό των συγκεκριμένων ανωμαλιών. Τα μοντέλα αυτά ανταποκρίνονται στις κυρίαρχες τάσεις που επικρατούν στη διεθνή βιβλιογραφία. Σε όλα κυριαρχούν οι Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης (Long Short-term Memory Units), που είναι οι πλέον κατάλληλες για την επεξεργασία δεδομένων που υπόκεινται σε κάποια χρονική ακολουθία. Γίνεται υλοποίηση ενός απλού Αναδρομικού Νευρωνικού Δικτύου με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Recurrent Neural Network), ενός Αυτοκωδικοποιητή με Μονάδες Μακράς Βραχυπρόθεσμης Μνήμης(Long Short-term Memory Autoencoder), ενός Παραλλαγμένου Αυτοκωδικοποιητή(Variational Autoencoder) και ενός Γεννητικού Ανταγωνιστικού Δικτύου(Generative Adversarial Network), για την εκμάθηση του αναμενόμενου προτύπου εξέλιξης της χρονοσειράς. Στη συνέχεια, με την επιλογή ενός κατάλληλου Κατωφλιού(Threshold), επισημαίνονται τα σημεία που υπάρχει μεγάλη πιθανότητα να προκύπτει κάποια μη κανονική συμπεριφορά. Γίνεται εφαρμογή τους σε μια γκάμα δεδομένων, που καλύπτουν αρκετές περιπτώσεις, τόσο ως προς την πηγή τους, όσο και ως προς την ποιοτική διαχείρισή τους. Επιπλέον, πραγματοποιείται χρήση διαφόρων τεχνικών προεπεξεργασίας και αναπαράστασης των προαναφερθέντων δεδομένων, καθώς και οπτικοποίηση της πορείας εκπαίδευσης των μοντέλων και σύγκριση των αποτελεσμάτων τους. In this work we exploit the utilization of Machine Learning methods and especially Deep Learning methods for anomaly detection in time series data. Nowadays, a huge amount of information is observed in a variety of areas, which is gathered in time series formation. The processing and apprehension of this data is crucial in order to achieve systems administration and decision-making. Beyond the well known case of future projection, another vital issue which occurs is the ability to detect points or sequences of points which display abnormal behavior in regard to the rest of the time series. Unexpected values may indicate the existence of an unintended situation which demands taking action by the users. In fact, the enormity of information provided is too massive to be handled entirely by the human factor. So, methods that human interaction is restricted in a final stage, after the labelling of probably problematic points by a calculating system, are gaining ground. Apparently, as Deep Learning is a cutting-edge branch with increasing achievements in a variety of areas, it is expected to play a critical role in the development of such systems. Focusing on time series data which contain points that their values exhibit some unacceptable variance, we construct four(4) Artificial Neural Networks models to detect these anomalies. These models are in compliance with the prevailing trends in international bibliography. In all of them, the Long Short-term Memory Units are predominant as they are the most appropriate for handling data which occur in sequences. We implement successively a Long Short-term Memory Recurrent Neural Network, a Long Short-term Memory Autoencoder, a Variational Autoencoder and a Generative Adversarial Network. The aim of these models is to learn the anticipated pattern of evolution of each involved time series. Afterwards, with the selection of an appropriate threshold, the points that a major probability arises an abnormal behavior to exist are flagged. The models are implemented in an array of datasets. In addition, preprocessing techniques applied to the data and visualization and comparison of the results are included. 2022-11-07T10:24:31Z 2022-11-07T10:24:31Z 2021-10-08 https://hdl.handle.net/10889/23746 gr application/pdf