Περίληψη: | Στη παρούσα διπλωματική εργασία αναλύονται μέθοδοι για τη στατιστική ανάλυση
κατηγορικών δεδομένων, με έμφαση στη μέθοδο των Ιεραρχικών δέντρων
ταξινόμησης. Στη συνέχεια εφαρμόζονται στην ανάλυση πολιτικής δημοσκόπησης που
πραγματοποιήθηκε το Δεκέμβριο του
2014.Η στατιστική ανάλυση κατηγορικών δεδομένων απασχολεί πλήθος επιστημών όπως
στατιστικούς, κοινωνιολόγους, μαθηματικούς. Η δυσκολία, που αντιμετωπίζεται σε μια
τέτοια ανάλυση, είναι πως η θεωρία που εφαρμόζεται αφορά κυρίως περιγραφικά
στοιχεία του
δείγματος. Ένας άλλος τρόπος επεξεργασίας κατηγορικών δεδομένων
είναι τα Ιεραρχικά Δέντρα Ταξινόμησης
, τα οποία είναι δέντρα απόφασης που
καθορίζουν και απεικονίζουν τους παράγοντες που επηρεάζουν την εξαρτημένη
μεταβλητή που εξετάζουμε κά
θε φορά. Συγκεκριμένα, δημιουργούνται συνθήκες
απόφασης με τις ανεξάρτητες μεταβλητές οι οποίες ταξινομούν το δείγμα στις διάφορες
τιμές της εξαρτημένης μεταβλητής.
Στο πρώτο κεφάλαιο της παρούσας διπλωματικής παρουσιάζονται ορισμοί και βασικές
διαδικα
σίες που χρησιμοποιούνται στην στατιστική ανάλυση κατηγορικών δεδομένων,
ενώ στο δεύτερο κεφάλαιο γίνεται αναλυτική περιγραφή για το πως δημιουργούνται τα
δέντρα ταξινόμησης και παλινδρόμησης. Στο τρίτο κεφάλαιο δίνονται πληροφορίες για
το δείγμα και το ερ
ωτηματολόγιο που επεξεργαστήκαμε και το οποίο αφορά πολιτική
δημοσκόπηση και τέλος στο τέταρτο κεφάλαιο, με τη βοήθεια του στατιστικού πακέτου
της
R
, αναλύονται κάποια βασικά ερωτήματα του ερωτηματολογίου με τη μέθοδο των
δέντρων ταξινόμησης.
|