Περίληψη: | Σε αυτό το κεφάλαιο ο φοιτητής κατανοεί ότι τα δεδομένα, οι τύποι τους και η ποιότητά τους είναι ένα αναπόσπαστο κομμάτι στην διαδικασία της εξόρυξης δεδομένων. Γίνεται απόλυτα σαφές ότι η ποιότητα των δεδομένων καθορίζει σε μεγάλο βαθμό και την ποιότητα των αποτελεσμάτων της εξόρυξης δεδομένων. Οι παράμετροι εκείνοι των δεδομένων που επηρεάζουν την ποιότητά τους πρέπει να είναι σαφείς έτσι ώστε να είναι σε θέση κάποιος να τους αξιολογήσει και να τους βελτιώσει.<br/>Η προεπεξεργασία των δεδομένων αποτελεί το πιο επίπονο και χρονοβόρο κομμάτι στην διαδικασία της ανακάλυψης γνώσης από τα δεδομένα. Στόχος, επίσης, του κεφαλαίου είναι να εξοικειωθεί ο φοιτητής με όλες τις διαφορετικές μορφές της προεπεξεργασίας των δεδομένων και να είναι σε θέση να τις εφαρμόσει όπως επίσης να είναι σε θέση να εφαρμόζει τις τεχνικές αυτές μέσω ενός εργαλείου όπως το R.
|