Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων

Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Ανα...

Full description

Bibliographic Details
Main Author: Σταμούλη, Ιωάννα
Other Authors: Κωτσιαντής, Σωτήριος
Format: Thesis
Language:Greek
Published: 2016
Subjects:
Online Access:http://hdl.handle.net/10889/9336
Description
Summary:Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL.