Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση
Η παρούσα μεταπτυχιακή εργασία πραγματεύεται το γενικότερο πρόβλημα της ταξινόμησης, αξιοποιώντας τις τεχνικές της ασαφούς λογικής. Κύριος στόχος της είναι η ανάπτυξη μεθοδολογιών εξαγωγής ερμηνεύσιμων μοντέλων ταξινόμησης για την αντιμετώπιση προβλημάτων που χαρακτηρίζονται από υψηλή διαστατικότητα...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13162 |
id |
nemertes-10889-13162 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Ασαφής λογική Ασαφή σύνολα Δέντρα απόφασης Ασαφής δέντρα απόφασης Αλγόριθμος ID3 Ασαφής αλγόριθμος ID3 Συνάρτηση συμμετοχής Εντροπία Κέρδος πληροφορίας Λήψη αποφάσεων Εξαγωγή γνώσης Νευρωνικά δίκτυα Ασαφής εντροπία Machine learning Fuzzy logic Fuzzy sets Decision trees Fuzzy decision trees ID3 algorithm Fuzzy ID3 algorithm Membership function Entropy Information gain Decision making Export of knowledge Neural networks Fuzzy entropy |
spellingShingle |
Μηχανική μάθηση Ασαφής λογική Ασαφή σύνολα Δέντρα απόφασης Ασαφής δέντρα απόφασης Αλγόριθμος ID3 Ασαφής αλγόριθμος ID3 Συνάρτηση συμμετοχής Εντροπία Κέρδος πληροφορίας Λήψη αποφάσεων Εξαγωγή γνώσης Νευρωνικά δίκτυα Ασαφής εντροπία Machine learning Fuzzy logic Fuzzy sets Decision trees Fuzzy decision trees ID3 algorithm Fuzzy ID3 algorithm Membership function Entropy Information gain Decision making Export of knowledge Neural networks Fuzzy entropy Πετρόπουλος, Δημήτριος Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
description |
Η παρούσα μεταπτυχιακή εργασία πραγματεύεται το γενικότερο πρόβλημα της ταξινόμησης, αξιοποιώντας τις τεχνικές της ασαφούς λογικής. Κύριος στόχος της είναι η ανάπτυξη μεθοδολογιών εξαγωγής ερμηνεύσιμων μοντέλων ταξινόμησης για την αντιμετώπιση προβλημάτων που χαρακτηρίζονται από υψηλή διαστατικότητα του χώρου των χαρακτηριστικών. Για τον σκοπό αυτό θα υλοποιηθούν και θα συγκριθούν ως προς την απόδοση και την αποτελεσματικότητά τους, τα ασαφή δέντρα απόφασης τα οποία αντιμετωπίζουν αποτελεσματικά ένα ευρύ φάσμα προβλημάτων ταξινόμησης του πραγματικού κόσμου αλλά και τα κλασσικά δέντρα απόφασης, τα οποία αποτελούν μια από τις πιο ευρέως χρησιμοποιούμενες πρακτικές μεθόδους για την εξαγωγή γνώσης και συμπερασμάτων χρησιμοποιώντας τον επαγωγικό συλλογισμό. Ο αλγόριθμος ID3 ο οποίος αρχικά προτάθηκε από τον Quinlan, χρησιμοποιεί την θεωρία πληροφορίας για τον προσδιορισμό του χαρακτηριστικού με το μεγαλύτερο κέρδος πληροφορίας. Παρόλα ο αλγόριθμος ID3 είναι αρκετά ασταθής, όταν έχει να αντιμετωπίσει σύνολα δεδομένων εκπαίδευσης με μικρές διαταραχές. Ο ασαφής αλγόριθμος ID3 βελτιώνει τις αστάθειες αυτές, λόγω της ελαστικότητας του φορμαλισμού των ασαφών συνόλων. Οι δύο παραπάνω μεθοδολογίες εμφανίζουν πλεονεκτήματα και μειονεκτήματα ανάλογα με την διαστατικότητα του χώρου εισόδου καθώς και την ισορροπία μεταξύ ακρίβειας και ταξινόμησης των συνόλων δεδομένων. Ιδιαίτερο χαρακτηριστικό των προτεινόμενων μεθοδολογιών είναι η δημιουργία απλών και εύληπτων μοντέλων ταξινόμησης, βασισμένα σε κανόνες οι οποίοι δεν διαφέρουν καθόλου από τον τρόπο με τον οποίο η ανθρώπινη σκέψη οδηγείτε σε συμπερασματικές προτάσεις. Οι προτεινόμενοι ταξινομητές αλλά και τα νευρωνικά δίκτυα θα εφαρμοστούν σε διάφορα σύνολα δεδομένων του πραγματικού κόσμου προκειμένου να μελετηθεί ο τρόπος με τον οποίο ανταποκρίνονται στα σύνολα αυτά και θα γίνει μια συγκριτική μελέτη προκειμένου να προσδιορίσουμε εάν η εφαρμογή της ασαφούς λογικής στα κλασσικά δέντρα απόφασης έχει ως αποτέλεσμα την εξαγωγή γνώσης η οποία μας προσφέρει μεγαλύτερη ακρίβεια. |
author2 |
Χατζηλυγερούδης, Ιωάννης |
author_facet |
Χατζηλυγερούδης, Ιωάννης Πετρόπουλος, Δημήτριος |
format |
Thesis |
author |
Πετρόπουλος, Δημήτριος |
author_sort |
Πετρόπουλος, Δημήτριος |
title |
Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
title_short |
Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
title_full |
Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
title_fullStr |
Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
title_full_unstemmed |
Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
title_sort |
ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13162 |
work_keys_str_mv |
AT petropoulosdēmētrios asaphēdentraapophaseōnparousiasēkaipeiramatikēaxiologēsē AT petropoulosdēmētrios fuzzydecisiontreespresentationandexperimentalevaluation |
_version_ |
1799945014342582272 |
spelling |
nemertes-10889-131622022-09-06T07:03:16Z Ασαφή δέντρα αποφάσεων : παρουσίαση και πειραματική αξιολόγηση Fuzzy decision trees : presentation and experimental evaluation Πετρόπουλος, Δημήτριος Χατζηλυγερούδης, Ιωάννης Petropoulos, Dimitrios Hatzilygeroudis, Ioannis Μηχανική μάθηση Ασαφής λογική Ασαφή σύνολα Δέντρα απόφασης Ασαφής δέντρα απόφασης Αλγόριθμος ID3 Ασαφής αλγόριθμος ID3 Συνάρτηση συμμετοχής Εντροπία Κέρδος πληροφορίας Λήψη αποφάσεων Εξαγωγή γνώσης Νευρωνικά δίκτυα Ασαφής εντροπία Machine learning Fuzzy logic Fuzzy sets Decision trees Fuzzy decision trees ID3 algorithm Fuzzy ID3 algorithm Membership function Entropy Information gain Decision making Export of knowledge Neural networks Fuzzy entropy Η παρούσα μεταπτυχιακή εργασία πραγματεύεται το γενικότερο πρόβλημα της ταξινόμησης, αξιοποιώντας τις τεχνικές της ασαφούς λογικής. Κύριος στόχος της είναι η ανάπτυξη μεθοδολογιών εξαγωγής ερμηνεύσιμων μοντέλων ταξινόμησης για την αντιμετώπιση προβλημάτων που χαρακτηρίζονται από υψηλή διαστατικότητα του χώρου των χαρακτηριστικών. Για τον σκοπό αυτό θα υλοποιηθούν και θα συγκριθούν ως προς την απόδοση και την αποτελεσματικότητά τους, τα ασαφή δέντρα απόφασης τα οποία αντιμετωπίζουν αποτελεσματικά ένα ευρύ φάσμα προβλημάτων ταξινόμησης του πραγματικού κόσμου αλλά και τα κλασσικά δέντρα απόφασης, τα οποία αποτελούν μια από τις πιο ευρέως χρησιμοποιούμενες πρακτικές μεθόδους για την εξαγωγή γνώσης και συμπερασμάτων χρησιμοποιώντας τον επαγωγικό συλλογισμό. Ο αλγόριθμος ID3 ο οποίος αρχικά προτάθηκε από τον Quinlan, χρησιμοποιεί την θεωρία πληροφορίας για τον προσδιορισμό του χαρακτηριστικού με το μεγαλύτερο κέρδος πληροφορίας. Παρόλα ο αλγόριθμος ID3 είναι αρκετά ασταθής, όταν έχει να αντιμετωπίσει σύνολα δεδομένων εκπαίδευσης με μικρές διαταραχές. Ο ασαφής αλγόριθμος ID3 βελτιώνει τις αστάθειες αυτές, λόγω της ελαστικότητας του φορμαλισμού των ασαφών συνόλων. Οι δύο παραπάνω μεθοδολογίες εμφανίζουν πλεονεκτήματα και μειονεκτήματα ανάλογα με την διαστατικότητα του χώρου εισόδου καθώς και την ισορροπία μεταξύ ακρίβειας και ταξινόμησης των συνόλων δεδομένων. Ιδιαίτερο χαρακτηριστικό των προτεινόμενων μεθοδολογιών είναι η δημιουργία απλών και εύληπτων μοντέλων ταξινόμησης, βασισμένα σε κανόνες οι οποίοι δεν διαφέρουν καθόλου από τον τρόπο με τον οποίο η ανθρώπινη σκέψη οδηγείτε σε συμπερασματικές προτάσεις. Οι προτεινόμενοι ταξινομητές αλλά και τα νευρωνικά δίκτυα θα εφαρμοστούν σε διάφορα σύνολα δεδομένων του πραγματικού κόσμου προκειμένου να μελετηθεί ο τρόπος με τον οποίο ανταποκρίνονται στα σύνολα αυτά και θα γίνει μια συγκριτική μελέτη προκειμένου να προσδιορίσουμε εάν η εφαρμογή της ασαφούς λογικής στα κλασσικά δέντρα απόφασης έχει ως αποτέλεσμα την εξαγωγή γνώσης η οποία μας προσφέρει μεγαλύτερη ακρίβεια. This master thesis studies the general problem of classification, using fuzzy logic techniques. Its main subject is to develop methodologies to derive interpretable classification models in order to deal with problems that characterized by high dimensionality of the attribute space. For this purpose, fuzzy decision trees will be implemented and compared in terms of their efficiency and effectiveness, which effectively tackle a wide range of real-world classification problems. On the other hand classical decision trees, which are one of the most widely used practical methods for drawing knowledge and conclusions using inductive reasoning, will be implemented. The ID3 algorithm is introduced by Quinlan, using information theory to determine the most informative attribute. ID3 has highly unstable classifiers with respect to minor perturbation in training data. However, the ID3 algorithm is quite unstable when it comes to handling training data sets with minor disorders. The fuzzy ID3 algorithm improves these instabilities due to the elasticity of fuzzy sets formalism. The two above methodologies have advantages and disadvantages depending on the dimensionality of the input space as well as the balance between accuracy and classification of the data sets. The proposed methodologies characterized by the creation of simple and comprehensible classification models based on rules that are no different from the way in which human thought leads you to conclusions. The proposed classifiers but also the neural networks will be applied to various real-world data sets. Subsequently a comparative study will be carried out in order to determine whether applying fuzzy logic to classical decision trees results in knowledge extraction which offer us greater accuracy. 2020-02-06T21:42:21Z 2020-02-06T21:42:21Z 2019-12 Thesis http://hdl.handle.net/10889/13162 gr 0 application/pdf |