Αλγόριθμοι Εξόρυξης Διαδικασιών (process mining) στο Περιβάλλον Ανάπτυξης Spark – Alpha Algorithm

Αντικείμενο της μεταπτυχιακής διπλωματικής εργασίας τoυ Bλάση Πίτσιου από το Τμήμα Μηχανικών Η/Υ και Πληροφορικής του Πανεπιστημίου Πατρών, είναι το ακόλουθο:

H εξόρυξη διαδικασιών (process mining) αποτελεί έναν συνδετικό κρίκο ανάμεσα στην εξόρυξη δεδομένων (data mining) και στην διαχείριση διαδικασιών σε επιχειρήσεις (business process management). Συγκεκριμένα αποτελεί μια οικογένεια από τεχνικές που υποστηρίζουν την ανάλυση των διαδικασιών βασιζόμενες σε διάφορα σύνολα γεγονότων (event logs). Σκοπός της εξόρυξης διαδικασιών (process mining) είναι η κατανόηση αλλά και η βελτίωση της απόδοσης των διαδικασιών μιας επιχείρησης.

Η παρούσα μεταπτυχιακή διπλωματική εργασία επικεντρώνεται στο κατά πόσο είναι δυνατή η παραλληλοποίηση τέτοιων αλγορίθμων εξόρυξης διαδικασιών και ποιο είναι το όφελος από την παράλληλη εκτέλεση τέτοιων αλγορίθμων. Συγκεκριμένα μελετάται ο αλγόριθμος Alpha (Alpha Algorithm), ο οποίος κατασκευάζει διαγράμματα PetriNet από ακολουθίες γεγονότων. Στόχος αποτελεί η ανάπτυξη του συγκεκριμένου αλγορίθμου χωρίς την χρήση τεχνικών παραλληλοποίησης και στη συνέχεια η ανάπτυξη του ίδιου αλγορίθμου με τεχνικές mapReduce σε περιβάλλον ανάπτυξης Spark, όπου ο αλγόριθμος θα εκτελείται παράλληλα.

Επιπλέον έγινε εκτέλεση πειραμάτων σε πραγματικά δεδομένα και αξιολόγηση των αποτελεσμάτων της σειριακής εκτέλεσης του αλγορίθμου αλλά και της παράλληλης εκτέλεσης σε μια συστάδα υπολογιστών (cluster) με χρήση του Spark framework. Η ανάπτυξη του αλγόριθμου Alpha υλοποιήθηκε με πηγαίο κώδικα σε Scala και αξιολογήθηκε εκτενώς πειραματικά σε πραγματικά δεδομένα.

Ακολουθεί ένα video demonstration της εφαρμογής:

Ο κώδικας της διπλωματικής εργασίας είναι διαθέσιμος εδώ και το κείμενο εδώ.

Αν κάποιος θέλει να επικοινωνήσει με τον Bλάση Πίτσιο μπορεί εδώ: vlassis.pitsios{AT}gmail[DOT]com