Εξόρυξη γνώσης από δεδομένα αθλητισμού
Η πρόβλεψη των αποτελεσμάτων αθλητικών εκδηλώσεων ήταν ανέκαθεν μια προκλητική και ελκυστική δουλειά. Eιδικότερα εάν λάβουμε υπόψιν το πλήθος των επαγγελματιών που ασχολούνται με αυτό όπως οι αθλητές, αθλητικογράφοι, προπονητές , αθλητικοί αναλυτές, δημοσιογράφοι αλλά και επιχειρηματικοί οργανισμοί...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15507 |
id |
nemertes-10889-15507 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-155072022-09-05T06:58:30Z Εξόρυξη γνώσης από δεδομένα αθλητισμού Knowledge extraction from sports data Κοτσάμπασης, Αλέξης Kotsampasis, Alexis Μηχανική μάθηση Εξόρυξη πληροφορίας Δεδομένα αθλητισμού Μηχανές διανυσμάτων υποστήριξης Machine learning Data mining Sports data Support vector machine NBA Η πρόβλεψη των αποτελεσμάτων αθλητικών εκδηλώσεων ήταν ανέκαθεν μια προκλητική και ελκυστική δουλειά. Eιδικότερα εάν λάβουμε υπόψιν το πλήθος των επαγγελματιών που ασχολούνται με αυτό όπως οι αθλητές, αθλητικογράφοι, προπονητές , αθλητικοί αναλυτές, δημοσιογράφοι αλλά και επιχειρηματικοί οργανισμοί όπως στοιχηματικές εταιρείες. Στην παρούσα διπλωματική παρουσιάζεται μια μεθοδολογία τεχνικών μηχανικής μάθησης και εξόρυξης πληροφορίας από αθλητικά δεδομένα, πιο αναλυτικά ως δεδομένα χρησιμοποιήθηκαν στατιστικά και αποτελέσματα από αγώνες NBA (National Basketball Association). Συγκεκριμένα, τα δεδομένα επεξεργάστηκαν και τροποποιήθηκαν κατάλληλα με την χρήση της Matlab και αλγορίθμων μηχανικής εκμάθησης , με απώτερο σκοπό την πρόβλεψη αποτελεσμάτων στους εκάστοτε αγώνες. Η προσέγγιση του πειράματος ακολουθεί την λογική σετ εκπαίδευσης και σετ ελέγχου (trainset-testset), για τα στατιστικά κάθε μίας από τις τριάντα ομάδες του NBA,για κάθε έναν από ογδόντα δυο αγώνες της κανονικής περιόδου. Η επιλογή των κατάλληλων μεγεθών της τελικής εργασίας ,έγινε ύστερα από δοκιμές που πραγματοποιήθηκαν σε πειραματικό επίπεδο τόσο στην επιλογή των χαρακτηριστικών (features) όσο και σε αυτή των ταξινομητών (classifiers), με κύριο άξονα πάντα, την ακρίβεια και την απόδοση των προβλέψεων. Αρχικά χρησιμοποιήθηκε τετραγωνική παλινδρόμηση(Quadratic Regression) για τον υπολογισμό δεδομένων . Έπειτα τόσο στα δεδομένα που προήλθαν από την τετραγωνική παλινδρόμηση όσο και στα ρεαλιστικά δεδομένα έγινε χρήση των αλγορίθμων δυαδικού ταξινομητή μιας κλάσης ( Binary Classifier) , Κυβικού ταξινομητή ( Cubic Classifier ) ,Τετραγωνικού ταξινομητή ( Quadratic Classifier ) , Γκαουσιανού-Κέρνελ ταξινομητή ( Gaussian-Kernel Classifier ) και Γραμμικού ταξινομητή ( Linear Classifier ) σε Μηχανές Διανυσμάτων Υποστήριξης SVM (Support Vector Machines) .Ένας ακόμα αλγόριθμος που χρησιμοποιήθηκε είναι ο Νέιβς Μπαϊεζ ταξινομητής ( Naïve Bayes Classifier ) . The prediction of sport event results has always been an attractive but also a demanding challenge. Especially, considering the number of professionals involved, including athletes, managers, sports journalists, sports analysts and businesses such as betting companies. Through the current thesis, a methodology of machine learning techniques and data extraction from sports data is developed and hence presented. More specifically, the data being used are stats and results obtained from NBA games, which have been evaluated and processed carefully using MATLAB and machine learning algorithms to predict NBA game results. This approach is developed using a train-test set format, considering team stats from each of the NBA teams (30 teams), for every NBA game of the regular season (82 fixtures). The suitable parameters, including features and classifiers were selected based on trial and error experimental rounds, considering prediction accuracy and efficiency .At first Quadratic Regression was used in order to calculate the data of the experiment. After this in the results of the Quadratic Regression and at the real life data a plethora of algorithms were implemented using Binary Classifier, Quadratic Classifier ,Cubic Classifier ,Gaussian-Kernel Classifier and Linear Classifier in Support Vector Machines (SVM) and also Naives Bayes algorithm Classifier was used 2021-11-03T06:34:21Z 2021-11-03T06:34:21Z 2021-10-27 http://hdl.handle.net/10889/15507 gr winrar application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Εξόρυξη πληροφορίας Δεδομένα αθλητισμού Μηχανές διανυσμάτων υποστήριξης Machine learning Data mining Sports data Support vector machine NBA |
spellingShingle |
Μηχανική μάθηση Εξόρυξη πληροφορίας Δεδομένα αθλητισμού Μηχανές διανυσμάτων υποστήριξης Machine learning Data mining Sports data Support vector machine NBA Κοτσάμπασης, Αλέξης Εξόρυξη γνώσης από δεδομένα αθλητισμού |
description |
Η πρόβλεψη των αποτελεσμάτων αθλητικών εκδηλώσεων ήταν ανέκαθεν μια προκλητική και ελκυστική δουλειά. Eιδικότερα εάν λάβουμε υπόψιν το πλήθος των επαγγελματιών που ασχολούνται με αυτό όπως οι αθλητές, αθλητικογράφοι, προπονητές , αθλητικοί αναλυτές, δημοσιογράφοι αλλά και επιχειρηματικοί οργανισμοί όπως στοιχηματικές εταιρείες. Στην παρούσα διπλωματική παρουσιάζεται μια μεθοδολογία τεχνικών μηχανικής μάθησης και εξόρυξης πληροφορίας από αθλητικά δεδομένα, πιο αναλυτικά ως δεδομένα χρησιμοποιήθηκαν στατιστικά και αποτελέσματα από αγώνες NBA (National Basketball Association). Συγκεκριμένα, τα δεδομένα επεξεργάστηκαν και τροποποιήθηκαν κατάλληλα με την χρήση της Matlab και αλγορίθμων μηχανικής εκμάθησης , με απώτερο σκοπό την πρόβλεψη αποτελεσμάτων στους εκάστοτε αγώνες. Η προσέγγιση του πειράματος ακολουθεί την λογική σετ εκπαίδευσης και σετ ελέγχου (trainset-testset), για τα στατιστικά κάθε μίας από τις τριάντα ομάδες του NBA,για κάθε έναν από ογδόντα δυο αγώνες της κανονικής περιόδου. Η επιλογή των κατάλληλων μεγεθών της τελικής εργασίας ,έγινε ύστερα από δοκιμές που πραγματοποιήθηκαν σε πειραματικό επίπεδο τόσο στην επιλογή των χαρακτηριστικών (features) όσο και σε αυτή των ταξινομητών (classifiers), με κύριο άξονα πάντα, την ακρίβεια και την απόδοση των προβλέψεων. Αρχικά χρησιμοποιήθηκε τετραγωνική παλινδρόμηση(Quadratic Regression) για τον υπολογισμό δεδομένων . Έπειτα τόσο στα δεδομένα που προήλθαν από την τετραγωνική παλινδρόμηση όσο και στα ρεαλιστικά δεδομένα έγινε χρήση των αλγορίθμων δυαδικού ταξινομητή μιας κλάσης ( Binary Classifier) , Κυβικού ταξινομητή ( Cubic Classifier ) ,Τετραγωνικού ταξινομητή ( Quadratic Classifier ) , Γκαουσιανού-Κέρνελ ταξινομητή ( Gaussian-Kernel Classifier ) και Γραμμικού ταξινομητή ( Linear Classifier ) σε Μηχανές Διανυσμάτων Υποστήριξης SVM (Support Vector Machines) .Ένας ακόμα αλγόριθμος που χρησιμοποιήθηκε είναι ο Νέιβς Μπαϊεζ ταξινομητής ( Naïve Bayes Classifier ) . |
author2 |
Kotsampasis, Alexis |
author_facet |
Kotsampasis, Alexis Κοτσάμπασης, Αλέξης |
author |
Κοτσάμπασης, Αλέξης |
author_sort |
Κοτσάμπασης, Αλέξης |
title |
Εξόρυξη γνώσης από δεδομένα αθλητισμού |
title_short |
Εξόρυξη γνώσης από δεδομένα αθλητισμού |
title_full |
Εξόρυξη γνώσης από δεδομένα αθλητισμού |
title_fullStr |
Εξόρυξη γνώσης από δεδομένα αθλητισμού |
title_full_unstemmed |
Εξόρυξη γνώσης από δεδομένα αθλητισμού |
title_sort |
εξόρυξη γνώσης από δεδομένα αθλητισμού |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/15507 |
work_keys_str_mv |
AT kotsampasēsalexēs exoryxēgnōsēsapodedomenaathlētismou AT kotsampasēsalexēs knowledgeextractionfromsportsdata |
_version_ |
1771297162870652928 |