Περίληψη: | Οι τεχνικές εξόρυξης γνώσης από Βάσεις Δεδομένων έχουν αναπτυχθεί ραγδαία τα τελευταία χρόνια. Η γνώση εκφράζεται μέσα από κανόνες οι οποίοι μπορεί να αποδειχθούν καταλυτικοί στη λήψη αποφάσεων από τα στελέχη μιας επιχείρησης. Ένας τομέας, στον οποίο σαφέστατα οι αλγόριθμοι εξόρυξης γνώσης βρίσκουν ένα αρκετά ευρύ φάσμα εφαρμογών, είναι ο τομέας της Ιατρικής και, ειδικότερα, της διάγνωσης μίας πάθησης - νόσου.
Ως μελέτη περίπτωσης, η πάθηση στην οποία επικεντρωθήκαμε είναι ο αυτισμός της παιδικής ηλικίας. Το «ΠΑΥΕΥΣ» είναι ένα Πρότυπο Σύστημα Υποστήριξης Ατόμων με Αυτισμό βασιζόμενο σε ένα Ευφυές Πληροφοριακό Σύστημα. Το σύστημα παρέχει τη δυνατότητα καταχώρησης περιστατικού που χρήζει παρέμβασης αλλά και εμπλουτισμό της βάσης Γνώσης με καταχώρηση περίπτωσης. Επιπλέον, προσφέρει τη δυνατότητα αξιολόγησης των προτεινόμενων παρεμβάσεων αλλά και μια πρώιμη διάγνωση με τη μορφή ειδικά σχεδιασμένων & προσαρμοσμένων ερωτήσεων. Αυτές οι ερωτήσεις είναι ήδη αναγνωρισμένες διεθνώς και για παιδιά ηλικίας 0-4 χρονών επιλέχθηκαν τα ερωτηματολόγια CASD, MCHAT και CSBS-DP και 4-11 χρονών τα ερωτηματολόγια AQ, CASD και SRS.
Το πλήθος αυτών των ερωτήσεων για κάθε ερωτηματολόγιο είναι πολύ μεγάλο και ο απώτερος στόχος της συγκεκριμένης πτυχιακής εργασίας είναι να δημιουργηθεί με τη χρήση τεχνικών data mining για την ανάλυση συμπληρωμένων ερωτηματολογίων ένα νέο σετ ερωτήσεων που είναι πολύ μικρότερο σε πλήθος, αλλά παρέχει εξίσου υψηλής ακρίβειας αποτελέσματα.
Για το σκοπό αυτό, στην συγκεκριμένη εργασία για τα ερωτηματολόγια από 4-11 στα πλαίσια του ΠΑΥΕΥΣ, αύξησα τον αριθμό των συμπληρωμένων ερωτηματολογίων και εν συνεχεία επαλήθευσα τα υπάρχοντα αποτελέσματα, ενώ για τα ερωτηματολόγια 0-4 συνέλεξα νέα συμπληρωμένα ερωτηματολόγια εξ αρχής και με τη βοήθεια του Δημοτικού Βρεφοκομείου Πατρών, για περιστατικά παιδιών που δεν έχουν διαγνωστεί με αυτισμό.
Επίσης συμπληρώθηκαν ερωτηματολόγια από γονείς παιδιών με διαγνωσμένο από ειδικό Ιατρό αυτισμό. Όπως αναφέρθηκε ήδη η επιλογή των ερωτήσεων προς τους γονείς έγινε με κριτήριο τη μελέτη μιας συγκεκριμένης βιβλιογραφίας σχετικά με τα συμπτώματα και τις συμπεριφορές ενός αυτιστικού παιδιού και διατυπώθηκαν με τέτοιον τρόπο ώστε μέσα από την απάντηση που δίνει ο γονέας στην εκάστοτε ερώτηση να δύναται να εξαχθεί μία σημαντική πληροφορία.
Εν συνεχεία, με βάση τα συμπληρωμένα ερωτηματολόγια μέσα από αυτές τις απαντήσεις, προσπάθησα να βγάλω συμπεράσματα, αφενός για τις εν τοις πράγμασι αιτίες που οδηγούν στη διάγνωση του αυτισμού και αφετέρου για τυχόν συσχετίσεις που μπορεί να υπάρχουν στα χαρακτηριστικά της συμπεριφοράς ενός παιδιού, με ή χωρίς αυτισμό. Οι αλγόριθμοι που επιλέχθηκαν για αυτό το σκοπό ήταν ο ID3 και ο Apriori.
Το λογισμικό που χρησιμοποιήθηκε για την πειραματική εφαρμογή των δυο προαναφερθέντων αλγορίθμων ήταν το WEKA, μία freeware εφαρμογή ειδική για (α) εξαγωγή δέντρων απόφασης, και (β) για εξαγωγή κανόνων συσχετίσεων. Εκτελέσαμε τον κάθε αλγόριθμο ξεχωριστά και καταγράψαμε τους κανόνες και τα αποτελέσματα που μας έδωσε.
Στη συνέχεια περάσαμε στο στάδιο της αποτίμησης των αποτελεσμάτων. Καταγράψαμε τα πλεονεκτήματα και τα μειονεκτήματα του κάθε αλγόριθμου, αναφέραμε πιθανούς τρόπους που μπορεί να λειτουργήσουν συμπληρωματικά μεταξύ τους και προτείναμε τρόπους βελτίωσης του ερωτηματολογίου, ώστε να μπορούμε να εξάγουμε ακόμη πιο χρήσιμους κανόνες στη συνέχεια.
Έχοντας αναλύσει τί είναι ανάλυση με χρήση data mining και ποια από τα στάδια του σχεδιασμού του καλύπτει αυτή η εργασία, αναφέραμε αναλυτικά τις μετρικές αξιολόγησης των κανόνων ενός συστήματος, δηλαδή τις προϋποθέσεις και τις προδιαγραφές βάσει των οποίων οι κανόνες που εξάγονται από έναν αλγόριθμο εξόρυξης γνώσης μπορούν να θεωρηθούν αξιόπιστοι.
|