Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Ανα...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2016
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/9336 |
id |
nemertes-10889-9336 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-93362022-09-05T11:16:40Z Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων Addressing missing values in data mining problems Σταμούλη, Ιωάννα Κωτσιαντής, Σωτήριος Κωτσιαντής, Σωτήριος Ράγγος, Όμηρος Καββαδίας, Δημήτριος Stamouli, Ioanna Εξόρυξης γνώσης Ελλιπείς τιμές Αλγόριθμοι αντιμετώπισης ελλιπών τιμών Data mining Missing values Methods of coping with the missing values 006.312 Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL. Data mining is widely used in many areas. One of the challenges in the field of data mining is the occurrence of missing values that need to be handled. In this study we describe ways of dealing with missing values in order to improve the quality of information that is extracted from the data. We analyse different forms of missing data and what causes the data to be absent. Finally, we apply the different methods of coping with the missing values (Case Deletion or Ignore Missing, Mean and Mode Imputation, Regression Imputation, Hot-deck Imputation, k-Nearest Neighbor Imputation, Multiple Imputation, Decision Tree, Bayesian Iteration Imputation, Do not Impute, Concept Most Common Attribute Value for Symbolic Attributes and Concept Average Value for Numerical Attributes, Weighted imputation with k-Nearest Neighbour, k-means Clustering Imputation, Imputation with Fuzzy K-means Clustering, Support Vector Machines Imputation, Event Covering, Regularized Expectation-Maximization, Singular Value Decomposition Imputation, Local Least Squares Imputation) in databases and we use different text mining algorithms (Decision Tree, Neural Networks, Support Vector Machines, k-Nearest Neighbor, Boosting, Sequential Minimal Optimization, Multilayer perceptron) in R and the software tool KEEL. 2016-06-09T12:45:42Z 2016-06-09T12:45:42Z 2015-12 Thesis http://hdl.handle.net/10889/9336 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξης γνώσης Ελλιπείς τιμές Αλγόριθμοι αντιμετώπισης ελλιπών τιμών Data mining Missing values Methods of coping with the missing values 006.312 |
spellingShingle |
Εξόρυξης γνώσης Ελλιπείς τιμές Αλγόριθμοι αντιμετώπισης ελλιπών τιμών Data mining Missing values Methods of coping with the missing values 006.312 Σταμούλη, Ιωάννα Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
description |
Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL. |
author2 |
Κωτσιαντής, Σωτήριος |
author_facet |
Κωτσιαντής, Σωτήριος Σταμούλη, Ιωάννα |
format |
Thesis |
author |
Σταμούλη, Ιωάννα |
author_sort |
Σταμούλη, Ιωάννα |
title |
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
title_short |
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
title_full |
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
title_fullStr |
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
title_full_unstemmed |
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
title_sort |
αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων |
publishDate |
2016 |
url |
http://hdl.handle.net/10889/9336 |
work_keys_str_mv |
AT stamoulēiōanna antimetōpisēellipōntimōnseproblēmataexoryxēsdedomenōn AT stamoulēiōanna addressingmissingvaluesindataminingproblems |
_version_ |
1771297210162479104 |