Περίληψη: | Τα εγκεφαλικά επεισόδια αποτελούν μια από τις σημαντικότερες αιτίες θανάτου τόσο στις Ηνωμένες πολιτείες όσο και στην Ευρώπη και τις αναπτυσσόμενες χώρες γενικά. Οι δύο κύριοι τύποι εγκεφαλικών που συναντώνται είναι τα ισχαιμικά και τα αιμορραγικά κάθε ένας από τους οποίους εμφανίζει ιδιαίτερα και ξεχωριστά χαρακτηριστικά ενώ παράλληλα οι προδιαθεσικοί παράγοντες που πρωτοστατούν σε κάθε είδος διαφέρουν επίσης. Παρά τις διαφορές που εμφανίζουν, το κοινό τους χαρακτηριστικό είναι πως επηρεάζουν τις ζωές των ασθενών πολλές φορές ανεπανόρθωτα κάτι που υπογραμμίζει τη σημασία της μελέτης συσχετιζόμενων παραγόντων και τελικά έγκαιρης πρόβλεψης, συναρτήσει αυτών, ενός τέτοιου επεισοδίου. Κινούμενοι σε αυτό το μήκος κύματος, στην παρούσα εργασία, διεξάγεται μελέτη σε 81 ασθενείς που πάσχουν από καρωτιδική νόσο και είναι είτε συμπτωματικοί είτε ασυμπτωματικοί ενώ παράλληλα φέρουν επιπρόσθετα χαρακτηριστικά, κλινικά και μη. Σε πρώτο στάδιο, πραγματοποιείται στατιστική ανάλυση για τη μελέτη της στατιστικής σημαντικότητας τους δείγματος ενώ στη συνέχεια, γίνεται προσπάθεια εξόρυξης γνώσης από τα δεδομένα αυτά ώστε καταγραφούν οι αντίστοιχες παρατηρήσεις σχετικά με τον τρόπο συσχέτισης των προδιαθεσικών παραγόντων που έχουμε στη διάθεσή μας με την πιθανότητα ο αντίστοιχος ασθενής θα εμφανίσει εγκεφαλικό ή όχι. Σχετικά με τη στατιστική σημαντικότητα των δεδομένων πραγματοποιούνται τα αντίστοιχα τεστ Chi – squared και Fisher ενώ όσον αφορά τη μελέτη των συσχετίσεων γίνεται χρήση των αντίστοιχων correlation matrices και ιστογραμμάτων ενώ επιπλέον εφαρμόζεται και η μέθοδος PCA για να δειχθεί πως η μεγαλύτερη συσχέτιση παρουσιάζουν τα χαρακτηριστικά ηλικία, φύλο, ύπαρξη στεφανιαίας νόσου, σακχαρώδους διαβήτη, αορτικής υπέρτασης, το ποσοστό της καρωτιδικής στένωσης, το κάπνισμα και η θέση της καρωτιδικής αρτηρίας. Στη συνέχεια, ύστερα από κατάλληλα προεπεξεργασία των δεδομένων διεξάγεται το κομμάτι της ταξινόμησης ώστε βάσει των συσχετίσεων που αναλύονται προηγουμένως να γίνει η πρόβλεψη ενός εγκεφαλικού επεισοδίου. Οι ταξινομητές που επιλέχθηκαν για το σκοπό αυτό είναι οι ακόλουθοι: logistic regression, C5.0, Rpart Trees, Naive Bayes, SVM με διάφορους kernels όπως linear, radial, polynomial, sigmoid ενώ τέλος κατασκευάζεται ένα νευρωνικό δίκτυο. Προς βελτίωση των αποτελεσμάτων εφαρμόστηκαν και μέθοδοι Boosting/Bagging και συγκεκριμένα, Random Forest, Adaboost ενώ παράλληλα έγιναν και συνδυασμοί των ταξινομητών C5.0, Naive Bayes και SVM (με όλους τους προαναφερθέντες kernels) με τον Adam2. Προχωρώντας στην αξιολόγηση των κατάλληλων μετρικών αξιολόγησης ως καλύτερος ταξινομητής χαρακτηρίζεται ο Adam2 – SVM Polynomial με ακρίβεια 85%, sensitivity 90%, specificity 80% και p – value = 0.001.
|