Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων

Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Ανα...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σταμούλη, Ιωάννα
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9336
id nemertes-10889-9336
record_format dspace
spelling nemertes-10889-93362022-09-05T11:16:40Z Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων Addressing missing values in data mining problems Σταμούλη, Ιωάννα Κωτσιαντής, Σωτήριος Κωτσιαντής, Σωτήριος Ράγγος, Όμηρος Καββαδίας, Δημήτριος Stamouli, Ioanna Εξόρυξης γνώσης Ελλιπείς τιμές Αλγόριθμοι αντιμετώπισης ελλιπών τιμών Data mining Missing values Methods of coping with the missing values 006.312 Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL. Data mining is widely used in many areas. One of the challenges in the field of data mining is the occurrence of missing values that need to be handled. In this study we describe ways of dealing with missing values in order to improve the quality of information that is extracted from the data. We analyse different forms of missing data and what causes the data to be absent. Finally, we apply the different methods of coping with the missing values (Case Deletion or Ignore Missing, Mean and Mode Imputation, Regression Imputation, Hot-deck Imputation, k-Nearest Neighbor Imputation, Multiple Imputation, Decision Tree, Bayesian Iteration Imputation, Do not Impute, Concept Most Common Attribute Value for Symbolic Attributes and Concept Average Value for Numerical Attributes, Weighted imputation with k-Nearest Neighbour, k-means Clustering Imputation, Imputation with Fuzzy K-means Clustering, Support Vector Machines Imputation, Event Covering, Regularized Expectation-Maximization, Singular Value Decomposition Imputation, Local Least Squares Imputation) in databases and we use different text mining algorithms (Decision Tree, Neural Networks, Support Vector Machines, k-Nearest Neighbor, Boosting, Sequential Minimal Optimization, Multilayer perceptron) in R and the software tool KEEL. 2016-06-09T12:45:42Z 2016-06-09T12:45:42Z 2015-12 Thesis http://hdl.handle.net/10889/9336 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Εξόρυξης γνώσης
Ελλιπείς τιμές
Αλγόριθμοι αντιμετώπισης ελλιπών τιμών
Data mining
Missing values
Methods of coping with the missing values
006.312
spellingShingle Εξόρυξης γνώσης
Ελλιπείς τιμές
Αλγόριθμοι αντιμετώπισης ελλιπών τιμών
Data mining
Missing values
Methods of coping with the missing values
006.312
Σταμούλη, Ιωάννα
Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
description Η εξόρυξη γνώσης χρησιμοποιούνται σε πολλούς τομείς της σύγχρονης κοινωνίας. Σημειώνεται ότι στη συλλογή πληροφοριών παρατηρούνται ελλείψεις στα δεδομένα και στην παρούσα διπλωματική θα παρουσιαστούν τρόποι αντιμετώπισης αυτών με σκοπό όσο το δυνατόν καλύτερη εξαγωγή πληροφορίας από τα δεδομένα. Αναλύονται οι μορφές των ελλιπών τιμών και παρουσιάζονται οι αιτίες που τις προκαλούν. Γίνεται χρήση μεθόδων αντιμετώπισης ελλιπών τιμών (διαγραφή περίπτωσης, αντικατάσταση με μέση και κεντρική τιμή, παλινδρόμηση, Hot-deck καταλογισμός, k-πλησιέστερος γείτονας, πολλαπλός καταλογισμός, μέθοδος δένδρου απόφασης, μπεϋζιανή επανάληψη, κανένας καταλογισμός, μέθοδος αντικατάστασης με την πιο συχνή τιμή για τα κατηγορικά χαρακτηριστικά και με τη μέση τιμή για τα αριθμητικά χαρακτηριστικά, καταλογισμός στάθμισης με τον k- πλησιέστερο γείτονα, μέση τιμή k σημείων, καταλογισμός με μέση τιμή k-ασαφών σημείων, μηχανές διανυσμάτων υποστήριξης, κάλυψη περιπτώσεων, αλγόριθμος πρόβλεψης-μεγιστοποίησης, μοναδική τιμή αποσύνθεσης, ελάχιστος τοπικός τετραγωνικός καταλογισμός) σε βάσεις δεδομένων και εφαρμογή αλγορίθμων εξόρυξης γνώσης (δένδρο απόφασης, νευρωνικά δίκτυα, μηχανές διανυσμάτων υποστήριξης, k- πλησιέστερος γείτονας, αλγόριθμος προώθησης, αλγόριθμος ακολουθιακής ελάχιστης βελτιστοποίησης, πολυεπίπεδο νευρωνικό δίκτυο) στο στατιστικό πακέτο R και του εργαλείου KEEL.
author2 Κωτσιαντής, Σωτήριος
author_facet Κωτσιαντής, Σωτήριος
Σταμούλη, Ιωάννα
format Thesis
author Σταμούλη, Ιωάννα
author_sort Σταμούλη, Ιωάννα
title Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
title_short Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
title_full Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
title_fullStr Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
title_full_unstemmed Αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
title_sort αντιμετώπιση ελλιπών τιμών σε προβλήματα εξόρυξης δεδομένων
publishDate 2016
url http://hdl.handle.net/10889/9336
work_keys_str_mv AT stamoulēiōanna antimetōpisēellipōntimōnseproblēmataexoryxēsdedomenōn
AT stamoulēiōanna addressingmissingvaluesindataminingproblems
_version_ 1771297210162479104