Εξόρυξη γνώσης από δεδομένα αθλητισμού

Η πρόβλεψη των αποτελεσμάτων αθλητικών εκδηλώσεων ήταν ανέκαθεν μια προκλητική και ελκυστική δουλειά. Eιδικότερα εάν λάβουμε υπόψιν το πλήθος των επαγγελματιών που ασχολούνται με αυτό όπως οι αθλητές, αθλητικογράφοι, προπονητές , αθλητικοί αναλυτές, δημοσιογράφοι αλλά και επιχειρηματικοί οργανισμοί...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κοτσάμπασης, Αλέξης
Άλλοι συγγραφείς: Kotsampasis, Alexis
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15507
Περιγραφή
Περίληψη:Η πρόβλεψη των αποτελεσμάτων αθλητικών εκδηλώσεων ήταν ανέκαθεν μια προκλητική και ελκυστική δουλειά. Eιδικότερα εάν λάβουμε υπόψιν το πλήθος των επαγγελματιών που ασχολούνται με αυτό όπως οι αθλητές, αθλητικογράφοι, προπονητές , αθλητικοί αναλυτές, δημοσιογράφοι αλλά και επιχειρηματικοί οργανισμοί όπως στοιχηματικές εταιρείες. Στην παρούσα διπλωματική παρουσιάζεται μια μεθοδολογία τεχνικών μηχανικής μάθησης και εξόρυξης πληροφορίας από αθλητικά δεδομένα, πιο αναλυτικά ως δεδομένα χρησιμοποιήθηκαν στατιστικά και αποτελέσματα από αγώνες NBA (National Basketball Association). Συγκεκριμένα, τα δεδομένα επεξεργάστηκαν και τροποποιήθηκαν κατάλληλα με την χρήση της Matlab και αλγορίθμων μηχανικής εκμάθησης , με απώτερο σκοπό την πρόβλεψη αποτελεσμάτων στους εκάστοτε αγώνες. Η προσέγγιση του πειράματος ακολουθεί την λογική σετ εκπαίδευσης και σετ ελέγχου (trainset-testset), για τα στατιστικά κάθε μίας από τις τριάντα ομάδες του NBA,για κάθε έναν από ογδόντα δυο αγώνες της κανονικής περιόδου. Η επιλογή των κατάλληλων μεγεθών της τελικής εργασίας ,έγινε ύστερα από δοκιμές που πραγματοποιήθηκαν σε πειραματικό επίπεδο τόσο στην επιλογή των χαρακτηριστικών (features) όσο και σε αυτή των ταξινομητών (classifiers), με κύριο άξονα πάντα, την ακρίβεια και την απόδοση των προβλέψεων. Αρχικά χρησιμοποιήθηκε τετραγωνική παλινδρόμηση(Quadratic Regression) για τον υπολογισμό δεδομένων . Έπειτα τόσο στα δεδομένα που προήλθαν από την τετραγωνική παλινδρόμηση όσο και στα ρεαλιστικά δεδομένα έγινε χρήση των αλγορίθμων δυαδικού ταξινομητή μιας κλάσης ( Binary Classifier) , Κυβικού ταξινομητή ( Cubic Classifier ) ,Τετραγωνικού ταξινομητή ( Quadratic Classifier ) , Γκαουσιανού-Κέρνελ ταξινομητή ( Gaussian-Kernel Classifier ) και Γραμμικού ταξινομητή ( Linear Classifier ) σε Μηχανές Διανυσμάτων Υποστήριξης SVM (Support Vector Machines) .Ένας ακόμα αλγόριθμος που χρησιμοποιήθηκε είναι ο Νέιβς Μπαϊεζ ταξινομητής ( Naïve Bayes Classifier ) .