Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark
Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2019
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/12323 |
id |
nemertes-10889-12323 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-123232022-09-06T05:13:49Z Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark Process mining algorithms in apache Spark framework Πίτσιος, Βλάσης Ζαρολιάγκης, Χρήστος Σιούτας, Σπυρίδων Τζήμας, Γιάννης Pitsios, Vlasis Εξόρυξη διαδικασιών Αλγόριθμος Άλφα Περιβάλλον Spark Γλώσσα προγραμματισμού Scala Spark Scala Process mining Databricks Alpha algorithm 658.155 015 192 Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες σε διάφορα σύνολα γεγονότων (event logs). Σκοπός της εξόρυξης διαδικασιών (process mining) είναι η κατανόηση αλλά και η βελτίωση της απόδοσης των διαδικασιών μιας επιχείρησης. Η παρούσα πρόταση έρευνας επικεντρώνεται στο κατά πόσο είναι δυνατή η παραλληλοποίηση τέτοιων αλγορίθμων εξόρυξης διαδικασιών και ποιο είναι το όφελος από την παράλληλη εκτέλεση τέτοιων αλγορίθμων. Συγκεκριμένα μελετάται ο αλγόριθμος Alpha (Alpha Algorithm), ο οποίος κατασκευάζει διαγράμματα PetriNet από ακολουθίες γεγονότων. Στόχος αποτελεί η ανάπτυξη του συγκεκριμένου αλγορίθμου χωρίς την χρήση τεχνικών παραλληλοποίησης και στη συνέχεια η ανάπτυξη του ίδιου αλγορίθμου με τεχνικές mapReduce σε περιβάλλον ανάπτυξης Spark, όπου ο αλγόριθμος θα εκτελείται παράλληλα. Στη συνέχεια θα γίνει εκτέλεση πειραμάτων σε πραγματικά δεδομένα και αξιολόγηση των αποτελεσμάτων της σειριακής εκτέλεσης του αλγορίθμου αλλά και της παράλληλης εκτέλεσης σε μια συστάδα υπολογιστών (cluster) με χρήση του περιβάλλοντος ανάπτυξης Spark. Η ανάπτυξη του αλγόριθμου Alpha θα υλοποιηθεί με πηγαίο κώδικα σε Scala και θα αξιολογηθεί εκτενώς πειραματικά σε πραγματικά δεδομένα. Process mining is a link between data mining and business process management. In particular, it is a family of techniques that support the analysis of processes based on event logs. The purpose of process mining is to understand and improve the performance of business processes. This research proposal focuses on how parallelization of such process mining algorithms is possible and what is the benefit of the parallel execution of such algorithms. In particular, the Alpha Algorithm (a process mining algorithm), which builds PetriNet graphs from events sequences, is studied. The aim is to develop this algorithm without using parallelism techniques and then to develop the same algorithm with mapReduce techniques in Spark development environment, where the algorithm will run in parallel. In the next stage, experiments will be performed on real data and the results will be evaluated by comparing the serial execution of the algorithm with the parallel execution on a cluster using the Spark framework. The development of the Alpha algorithm will be implemented with Scala source code and will be extensively evaluated experimentally on real data. 2019-06-30T12:21:45Z 2019-06-30T12:21:45Z 2019-02 Thesis http://hdl.handle.net/10889/12323 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξη διαδικασιών Αλγόριθμος Άλφα Περιβάλλον Spark Γλώσσα προγραμματισμού Scala Spark Scala Process mining Databricks Alpha algorithm 658.155 015 192 |
spellingShingle |
Εξόρυξη διαδικασιών Αλγόριθμος Άλφα Περιβάλλον Spark Γλώσσα προγραμματισμού Scala Spark Scala Process mining Databricks Alpha algorithm 658.155 015 192 Πίτσιος, Βλάσης Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
description |
Η εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες σε διάφορα σύνολα γεγονότων (event logs). Σκοπός της εξόρυξης διαδικασιών (process mining) είναι η κατανόηση αλλά και η βελτίωση της απόδοσης των διαδικασιών μιας επιχείρησης.
Η παρούσα πρόταση έρευνας επικεντρώνεται στο κατά πόσο είναι δυνατή η παραλληλοποίηση τέτοιων αλγορίθμων εξόρυξης διαδικασιών και ποιο είναι το όφελος από την παράλληλη εκτέλεση τέτοιων αλγορίθμων. Συγκεκριμένα μελετάται ο αλγόριθμος Alpha (Alpha Algorithm), ο οποίος κατασκευάζει διαγράμματα PetriNet από ακολουθίες γεγονότων. Στόχος αποτελεί η ανάπτυξη του συγκεκριμένου αλγορίθμου χωρίς την χρήση τεχνικών παραλληλοποίησης και στη συνέχεια η ανάπτυξη του ίδιου αλγορίθμου με τεχνικές mapReduce σε περιβάλλον ανάπτυξης Spark, όπου ο αλγόριθμος θα εκτελείται παράλληλα. Στη συνέχεια θα γίνει εκτέλεση πειραμάτων σε πραγματικά δεδομένα και αξιολόγηση των αποτελεσμάτων της σειριακής εκτέλεσης του αλγορίθμου αλλά και της παράλληλης εκτέλεσης σε μια συστάδα υπολογιστών (cluster) με χρήση του περιβάλλοντος ανάπτυξης Spark. Η ανάπτυξη του αλγόριθμου Alpha θα υλοποιηθεί με πηγαίο κώδικα σε Scala και θα αξιολογηθεί εκτενώς πειραματικά σε πραγματικά δεδομένα. |
author2 |
Ζαρολιάγκης, Χρήστος |
author_facet |
Ζαρολιάγκης, Χρήστος Πίτσιος, Βλάσης |
format |
Thesis |
author |
Πίτσιος, Βλάσης |
author_sort |
Πίτσιος, Βλάσης |
title |
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
title_short |
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
title_full |
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
title_fullStr |
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
title_full_unstemmed |
Αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης Spark |
title_sort |
αλγόριθμοι εξόρυξης διαδικασιών στο περιβάλλον ανάπτυξης spark |
publishDate |
2019 |
url |
http://hdl.handle.net/10889/12323 |
work_keys_str_mv |
AT pitsiosblasēs algorithmoiexoryxēsdiadikasiōnstoperiballonanaptyxēsspark AT pitsiosblasēs processminingalgorithmsinapachesparkframework |
_version_ |
1771297361689051136 |