Περίληψη: | Ο σκοπός αυτής της διπλωματικής εργασίας είναι η ανάδειξη της ωφελιμότητας της εξόρυξης γνώσης από Βάσεις Δεδομένων επιχειρήσεων. Μέσα από μία εισαγωγική παράθεση διάφορων μεθόδων εξόρυξης γνώσης, οδηγούμαστε στην επιλογή των Κανόνων Συσχέτισης ως τη μέθοδο εξόρυξης γνώσης που θα αναλύσουμε και που πάνω σε αυτήν θα στηρίξουμε την έρευνά μας.
Για να κατανοήσουμε τον τρόπο με τον οποίο παράγεται η γνώση μέσω των Κανόνων Συσχέτισης, επιλέξαμε αλγόριθμους εύρεσης κανόνων όπως ο Apriori και ο FP-Growth. Αρχικά παραθέτουμε τον τρόπο με τον οποίο ο κάθε αλγόριθμος λειτουργεί, παίρνοντας το χαρακτηριστικό παράδειγμα των "καλαθιών αγοράς". Μέσα από την περιγραφή λειτουργίας του κάθε αλγόριθμου ανακαλύπτουμε τη σημασία θεμελιωδών μεγεθών που αφορούν τους Κανόνες Συσχέτισης, όπως η Εμπιστοσύνη και η Υποστήριξη.
Στη συνέχεια περνάμε από την θεωρία στην πράξη. Χρησιμοποιώντας δειγματοληπτικές Βάσεις Δεδομένων άλλοτε με λίγες εγγραφές και άλλοτε πιο μεγάλες, πειραματιζόμαστε με τους αλγόριθμους Apriori και FP-Growth, ώστε να ανακαλύψουμε την εξόρυξη γνώσης που πετυχαίνουν μέσα από τις πληροφορίες που δίνουμε από τις Βάσεις Δεδομένων. Αφενός για να κερδίσουμε χρόνο και αφετέρου για να προσδώσουμε αξιοπιστία στα αποτελέσματα των αλγορίθμων, επιλέξαμε το WEKA, ένα λογισμικό εξόρυξης γνώσης που, μεταξύ άλλων, παρέχει στο χρήστη τη δυνατότητα εξαγωγής Κανόνων Συσχέτισης και μάλιστα με τη χρήση των αλγορίθμων Apriori και FP-Growth. Μέσα από τα αποτελέσματα του WEKA οδηγούμαστε σε αξιολόγηση των Κανόνων Συσχέτισης όσον αφορά την εγκυρότητα, την ουσία και την ωφελιμότητά τους σε μία πιθανή λήξη απόφασης για μία επιχείρηση. Επιπροσθέτως, προχωρήσαμε και στην σύγκριση μεταξύ των δύο αλγορίθμων για να κατανοήσουμε τις περιπτώσεις που θα πρέπει να προτιμάται ο ένας αντί του άλλου.
Τέλος, εξαγάγαμε και συγκρίναμε τους χρόνους που απαιτούν οι αλγόριθμοι Apriori και FP-Growth για την εξαγωγή Κανόνων Συσχέτισης από μία Βάση Δεδομένων. Η διαδικασία αυτή έγινε για διαφορετικές τιμές των μέτρων σπουδαιότητας των αλγορίθμων προκειμένου να βρεθεί ποιος εκ των δύο είναι πιο αποδοτικός.
Συνεπώς, η διπλωματική μας εργασία εστιάζει μεν στην εξόρυξη γνώσης από Βάσεις Δεδομένων επιχειρήσεων, αλλά με τέτοιο τρόπο ώστε αυτοί οι κανόνες να είναι όσο το δυνατόν πιο ουσιαστικοί για εγκυρότερα συμπεράσματα, αλλά και με σκοπό να αποκόπτονται οι περιττοί κανόνες ώστε η επιχείρηση να κερδίζει χρόνο και χρήμα.
|