Δέντρα αποφάσεων
Μια ευρέως χρησιμοποιούμενη μέθοδος μηχανικής μάθησης είναι εκείνη που βασίζεται σε δένδρα απόφασης. Κατά την συγκεκριμένη μέθοδο, επιχειρείται η προσέγγιση μιας κατηγορικής συνάρτησης στόχου, ακολουθώντας την τεχνική του «διαίρει και βασίλευε» (Divide and Conquer). Ο χώρος του προβλήματος χωρίζεται...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10829 |
id |
nemertes-10889-10829 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-108292022-09-05T09:41:45Z Δέντρα αποφάσεων Decision trees Παϊδούση, Ελευθερία Κωτσιαντής, Σωτήριος Γράψα, Θεοδούλα Καββαδίας, Δημήτριος Paidousi, Eleftheria Εξόρυξη γνώσης Δέντρα αποφάσεων Data mining Decision trees 006.312 Μια ευρέως χρησιμοποιούμενη μέθοδος μηχανικής μάθησης είναι εκείνη που βασίζεται σε δένδρα απόφασης. Κατά την συγκεκριμένη μέθοδο, επιχειρείται η προσέγγιση μιας κατηγορικής συνάρτησης στόχου, ακολουθώντας την τεχνική του «διαίρει και βασίλευε» (Divide and Conquer). Ο χώρος του προβλήματος χωρίζεται σε περιοχές από στιγμιότυπα που φέρουν την ίδια τιμή ως προς κάποια μεταβλητή χαρακτηριστικό, και η διαδικασία επαναλαμβάνεται αναδρομικά, αναπαριστώντας με τον τρόπο αυτό το παραγόμενο μοντέλο ως δένδρο απόφασης. Στα θετικά σημεία των δέντρων απόφασης συγκαταλέγονται: η γρήγορη εκπαίδευση και η δυνατότητα μεταφοράς του παραγόμενου μοντέλου από δένδρο απόφασης σε ένα σύνολο κανόνων συμπερασμού (if – then rules), προς διευκόλυνση της κατανόησής του. Η παρούσα διπλωματική εργασία αποτελείται από δυο μέρη, το θεωρητικό και το πειραματικό μέρος. Στο θεωρητικό μέρος θα αναπτύξουμε τη πληθώρα των αλγορίθμων που υπάρχουν διαθέσιμοι και υλοποιούν την διαδικασία λήψης απόφασης χρησιμοποιώντας τα δέντρα απόφασης, καθώς και τις βελτιώσεις των αλγορίθμων που υλοποιήθηκαν με τη πάροδο των χρόνων. Εν συνεχεία, στο πειραματικό μέρος θα προσπαθήσουμε να αξιολογήσουμε την αποδοτικότητα των εν λόγω αλγορίθμων μέσω στατιστικής ανάλυσης ελεύθερα διαθέσιμων δεδομένων με σκοπό να καταλήξουμε στους «κορυφαίους» από πλευράς απόδοσης και αποτελεσματικότητας, εφόσον υπάρχουν. Στόχος αυτής της διπλωματικής εργασίας είναι η σύγκριση σχεδόν του συνόλου των σύγχρονων αλγορίθμων δημιουργίας δέντρων αποφάσεων σε ένα μεγάλο πλήθος ελεύθερα διαθέσιμων δεδομένων. Μια στατιστική ανάλυση των αποτελεσμάτων της πειραματικής διαδικασίας δίνει χρήσιμα συμπεράσματα ως προς την αποτελεσματικότητα και την αποδοτικότητα των συγκεκριμένων αλγορίθμων. A widely used method of mechanical learning is based on decision trees. In this method, it is attempted to approach a categorical target function, following its divide and conquer technique. The area of the problem is divided into areas of snapshots bearing the same value in relation to a variable feature, and the process is repeated retrospectively, thus representing the model produced as a decision tree. The positive points of the decision trees include: the rapid training and the transferability of the produced model from a decision tree to a set of rules of inference (if - then rules) to facilitate its understanding. This diploma thesis consists of two parts, the theoretical and the experimental part. In the theoretical part, we will develop the abundance of algorithms available and implement the decision-making process using the decision trees, as well as the improvements of the algorithms that have been implemented over the years. Then, in the experimental part, we will try to evaluate the efficiency of these algorithms through statistical analysis of freely available data in order to reach the "top" in terms of efficiency and effectiveness, if any. The aim of this diploma thesis is to compare almost all of the modern tree decision making algorithms to a large number of freely available data. A statistical analysis of the results of the experimental process gives useful conclusions as to the effectiveness and efficiency of the specific algorithms. 2017-12-12T06:50:52Z 2017-12-12T06:50:52Z 2016-09 Thesis http://hdl.handle.net/10889/10829 gr 0 application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξη γνώσης Δέντρα αποφάσεων Data mining Decision trees 006.312 |
spellingShingle |
Εξόρυξη γνώσης Δέντρα αποφάσεων Data mining Decision trees 006.312 Παϊδούση, Ελευθερία Δέντρα αποφάσεων |
description |
Μια ευρέως χρησιμοποιούμενη μέθοδος μηχανικής μάθησης είναι εκείνη που βασίζεται σε δένδρα απόφασης. Κατά την συγκεκριμένη μέθοδο, επιχειρείται η προσέγγιση μιας κατηγορικής συνάρτησης στόχου, ακολουθώντας την τεχνική του «διαίρει και βασίλευε» (Divide and Conquer). Ο χώρος του προβλήματος χωρίζεται σε περιοχές από στιγμιότυπα που φέρουν την ίδια τιμή ως προς κάποια μεταβλητή χαρακτηριστικό, και η διαδικασία επαναλαμβάνεται αναδρομικά, αναπαριστώντας με τον τρόπο αυτό το παραγόμενο μοντέλο ως δένδρο απόφασης. Στα θετικά σημεία των δέντρων απόφασης συγκαταλέγονται: η γρήγορη εκπαίδευση και η δυνατότητα μεταφοράς του παραγόμενου μοντέλου από δένδρο απόφασης σε ένα σύνολο κανόνων συμπερασμού (if – then rules), προς διευκόλυνση της κατανόησής του.
Η παρούσα διπλωματική εργασία αποτελείται από δυο μέρη, το θεωρητικό και το πειραματικό μέρος. Στο θεωρητικό μέρος θα αναπτύξουμε τη πληθώρα των αλγορίθμων που υπάρχουν διαθέσιμοι και υλοποιούν την διαδικασία λήψης απόφασης χρησιμοποιώντας τα δέντρα απόφασης, καθώς και τις βελτιώσεις των αλγορίθμων που υλοποιήθηκαν με τη πάροδο των χρόνων. Εν συνεχεία, στο πειραματικό μέρος θα προσπαθήσουμε να αξιολογήσουμε την αποδοτικότητα των εν λόγω αλγορίθμων μέσω στατιστικής ανάλυσης ελεύθερα διαθέσιμων δεδομένων με σκοπό να καταλήξουμε στους «κορυφαίους» από πλευράς απόδοσης και αποτελεσματικότητας, εφόσον υπάρχουν.
Στόχος αυτής της διπλωματικής εργασίας είναι η σύγκριση σχεδόν του συνόλου των σύγχρονων αλγορίθμων δημιουργίας δέντρων αποφάσεων σε ένα μεγάλο πλήθος ελεύθερα διαθέσιμων δεδομένων. Μια στατιστική ανάλυση των αποτελεσμάτων της πειραματικής διαδικασίας δίνει χρήσιμα συμπεράσματα ως προς την αποτελεσματικότητα και την αποδοτικότητα των συγκεκριμένων αλγορίθμων. |
author2 |
Κωτσιαντής, Σωτήριος |
author_facet |
Κωτσιαντής, Σωτήριος Παϊδούση, Ελευθερία |
format |
Thesis |
author |
Παϊδούση, Ελευθερία |
author_sort |
Παϊδούση, Ελευθερία |
title |
Δέντρα αποφάσεων |
title_short |
Δέντρα αποφάσεων |
title_full |
Δέντρα αποφάσεων |
title_fullStr |
Δέντρα αποφάσεων |
title_full_unstemmed |
Δέντρα αποφάσεων |
title_sort |
δέντρα αποφάσεων |
publishDate |
2017 |
url |
http://hdl.handle.net/10889/10829 |
work_keys_str_mv |
AT païdousēeleutheria dentraapophaseōn AT païdousēeleutheria decisiontrees |
_version_ |
1771297197812350976 |