Περίληψη: | Στην παρούσα διπλωματική εργασία κατασκευάζουμε μια μέθοδο προεπεξεργασίας αριθμητικών δεδομένων, χρησιμοποιόντας την Ανάλυση Παραγόντων
και την Θεωρία Απόκρισης Ερωτημάτων, ώστε να βελτιωθεί η απόδοση σε μοντέλα μηχανικής μάθησης. Αρχικά χρησιμοποιούμε την ανάλυση παραγόντων
για να βρούμε τους κοινούς παράγοντες των αριθμητικών δεδομένων. ΄Επειτα
εφαρμόζουμε τον αλγόριθμο K-Means ώστε να μετατρέψουμε τις αριθμητικές
τιμές σε βαθμολογίες. Τέλος για κάθε παράγοντα εφαρμόζουμε την Θεωρία
Απόκρισης Ερωτημάτων και εξάγουμε το σκορ σημαντικότητας του παράγοντα. Πιο συγκεκριμένα, στα πρώτα 2 κεφάλαια αναλύουμε τις στατιστικές
μεθόδους καθώς και τα μοντέλα μηχανικής μάθησης που εφαρμόσαμε. Στη
συνέχεια βλέπουμε το σετ δεδομένουν κόκκινου κρασιού που χρησιμοποιήθηκε και τον τρόπο εφαρμογής της μεθόδου που περιγράψαμε. Τέλος συκγρίνουμε τα αποτελέσματα 4 αλγόριθμων μηχανικής μάθησης για τα δεδομένα που
επεξεργαστήκαμε με τα αρχικά, όπου παρατηρούμε την απόδοση της μεθόδου
και εξάγουμε τα τελικά συμπεράσματα.
|