Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark

Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Πίτσιος, Βλάσης
Άλλοι συγγραφείς: Ζαρολιάγκης, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2019
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/12323
id nemertes-10889-12323
record_format dspace
spelling nemertes-10889-123232022-09-06T05:13:49Z Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark Process mining algorithms in apache Spark framework Πίτσιος, Βλάσης Ζαρολιάγκης, Χρήστος Σιούτας, Σπυρίδων Τζήμας, Γιάννης Pitsios, Vlasis Εξόρυξη διαδικασιών Αλγόριθμος Άλφα Περιβάλλον Spark Γλώσσα προγραμματισμού Scala Spark Scala Process mining Databricks Alpha algorithm 658.155 015 192 Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες σε διάφορα σύνολα γεγονότων (event logs). Σκοπός της εξόρυξης διαδικασιών (process mining) είναι η κατανόηση αλλά και η βελτίωση της απόδοσης των διαδικασιών μιας επιχείρησης. Η παρούσα πρόταση έρευνας επικεντρώνεται στο κατά πόσο είναι δυνατή η παραλληλοποίηση τέτοιων αλγορίθμων εξόρυξης διαδικασιών και ποιο είναι το όφελος από την παράλληλη εκτέλεση τέτοιων αλγορίθμων. Συγκεκριμένα μελετάται ο αλγόριθμος Alpha (Alpha Algorithm), ο οποίος κατασκευάζει διαγράμματα PetriNet από ακολουθίες γεγονότων. Στόχος αποτελεί η ανάπτυξη του συγκεκριμένου αλγορίθμου χωρίς την χρήση τεχνικών παραλληλοποίησης και στη συνέχεια η ανάπτυξη του ίδιου αλγορίθμου με τεχνικές mapReduce σε περιβάλλον ανάπτυξης Spark, όπου ο αλγόριθμος θα εκτελείται παράλληλα. Στη συνέχεια θα γίνει εκτέλεση πειραμάτων σε πραγματικά δεδομένα και αξιολόγηση των αποτελεσμάτων της σειριακής εκτέλεσης του αλγορίθμου αλλά και της παράλληλης εκτέλεσης σε μια συστάδα υπολογιστών (cluster) με χρήση του περιβάλλοντος ανάπτυξης Spark. Η ανάπτυξη του αλγόριθμου Alpha θα υλοποιηθεί με πηγαίο κώδικα σε Scala και θα αξιολογηθεί εκτενώς πειραματικά σε πραγματικά δεδομένα. Process mining is a link between data mining and business process management. In particular, it is a family of techniques that support the analysis of processes based on event logs. The purpose of process mining is to understand and improve the performance of business processes. This research proposal focuses on how parallelization of such process mining algorithms is possible and what is the benefit of the parallel execution of such algorithms. In particular, the Alpha Algorithm (a process mining algorithm), which builds PetriNet graphs from events sequences, is studied. The aim is to develop this algorithm without using parallelism techniques and then to develop the same algorithm with mapReduce techniques in Spark development environment, where the algorithm will run in parallel. In the next stage, experiments will be performed on real data and the results will be evaluated by comparing the serial execution of the algorithm with the parallel execution on a cluster using the Spark framework. The development of the Alpha algorithm will be implemented with Scala source code and will be extensively evaluated experimentally on real data. 2019-06-30T12:21:45Z 2019-06-30T12:21:45Z 2019-02 Thesis http://hdl.handle.net/10889/12323 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Εξόρυξη διαδικασιών
Αλγόριθμος Άλφα
Περιβάλλον Spark
Γλώσσα προγραμματισμού Scala
Spark
Scala
Process mining
Databricks
Alpha algorithm
658.155 015 192
spellingShingle Εξόρυξη διαδικασιών
Αλγόριθμος Άλφα
Περιβάλλον Spark
Γλώσσα προγραμματισμού Scala
Spark
Scala
Process mining
Databricks
Alpha algorithm
658.155 015 192
Πίτσιος, Βλάσης
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
description Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες σε διάφορα σύνολα γεγονότων (event logs). Σκοπός της εξόρυξης διαδικασιών (process mining) είναι η κατανόηση αλλά και η βελτίωση της απόδοσης των διαδικασιών μιας επιχείρησης. Η παρούσα πρόταση έρευνας επικεντρώνεται στο κατά πόσο είναι δυνατή η παραλληλοποίηση τέτοιων αλγορίθμων εξόρυξης διαδικασιών και ποιο είναι το όφελος από την παράλληλη εκτέλεση τέτοιων αλγορίθμων. Συγκεκριμένα μελετάται ο αλγόριθμος Alpha (Alpha Algorithm), ο οποίος κατασκευάζει διαγράμματα PetriNet από ακολουθίες γεγονότων. Στόχος αποτελεί η ανάπτυξη του συγκεκριμένου αλγορίθμου χωρίς την χρήση τεχνικών παραλληλοποίησης και στη συνέχεια η ανάπτυξη του ίδιου αλγορίθμου με τεχνικές mapReduce σε περιβάλλον ανάπτυξης Spark, όπου ο αλγόριθμος θα εκτελείται παράλληλα. Στη συνέχεια θα γίνει εκτέλεση πειραμάτων σε πραγματικά δεδομένα και αξιολόγηση των αποτελεσμάτων της σειριακής εκτέλεσης του αλγορίθμου αλλά και της παράλληλης εκτέλεσης σε μια συστάδα υπολογιστών (cluster) με χρήση του περιβάλλοντος ανάπτυξης Spark. Η ανάπτυξη του αλγόριθμου Alpha θα υλοποιηθεί με πηγαίο κώδικα σε Scala και θα αξιολογηθεί εκτενώς πειραματικά σε πραγματικά δεδομένα.
author2 Ζαρολιάγκης, Χρήστος
author_facet Ζαρολιάγκης, Χρήστος
Πίτσιος, Βλάσης
format Thesis
author Πίτσιος, Βλάσης
author_sort Πίτσιος, Βλάσης
title Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
title_short Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
title_full Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
title_fullStr Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
title_full_unstemmed Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
title_sort αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης spark
publishDate 2019
url http://hdl.handle.net/10889/12323
work_keys_str_mv AT pitsiosblasēs algorithmoiexoryxēsdiadikasiōnstoperiballonanaptyxēsspark
AT pitsiosblasēs processminingalgorithmsinapachesparkframework
_version_ 1771297361689051136