Περίληψη: | Η παρούσα διπλωματική εξετάζει την εφαρμογή τεχνικών μηχανικής μάθησης πάνω σε αθλητικά δεδομένα. Πιο συγκεκριμένα ως πηγή δεδομένων έχει χρησιμοποιήσει στατιστικά και αποτελέσματα από αγώνες NBA (National Basketball Association) και με την χρήση της python και αλγορίθμων εκμάθησης προσπαθεί να κάνει πρόβλεψη αποτελεσμάτων. Η πολυπλοκότητα και η δυσκολία κατ’ επέκταση της εργασίας έχει να κάνει με δύο βασικούς παράγοντες που συνοδεύουν το NBA αν όχι καθ’ όλη την διάρκεια της παρουσίας του σαν θεσμό, σίγουρα τις τελευταίες δύο δεκαετίες. Οι δύο αυτοί παράγοντες είναι η μεταβλητότητα του τόσο μέσα στην ίδια σεζόν όσο και από σεζόν σε σεζόν καθώς οι ομάδες αλλάζουν σύσταση διαρκώς και η μη προβλεψιμότητα καθώς όλες οι ομάδες είναι πιθανόν να κερδίσουν τον αντίπαλο τους σε οποιαδήποτε φάση της διοργάνωσης. Το τελευταίο αποτελεί για χρόνια αντικείμενο ενασχόλησης τόσο ειδικών στο αντικείμενο όπως είναι οι πρώην και νυν καταξιωμένοι αθλητές του χώρου, αθλητικογράφοι, δημοσιογράφοι αλλά και επιχειρηματικών οργανισμών όπως οι εταιρίες στοιχημάτων. Αυτή η αβεβαιότητα σωστής πρόβλεψης ίσως να είναι και ένας από τους λόγους που ο συγκεκριμένος θεσμός είναι τόσο αγαπητός και παρακολουθείται παγκοσμίως από το ευρύ κοινό. Σε αυτή την αβεβαιότητα προσπαθεί η παρούσα εργασία να καταφέρει να δώσει μια προσέγγιση στην πρόβλεψη του τελικού αποτελέσματος. Η προσέγγιση ακολουθεί την λογική train-test set, με βηματική αύξηση μεγέθους στο train set κατά έναν αγώνα σε κάθε πρόβλεψη και σταθερό μέγεθος στο test set που είναι ίσο με ένα και αφορά πάντα τον αγώνα πρόβλεψης. Οι προσεγγίσεις ξεκινούν απλά στην αρχή και γίνονται όλο και πιο πολύπλοκες καθώς γίνεται εμβάθυνση εμπειρικά και πειραματικά, τόσο στα μεγέθη των train sets κατά την πορεία της σεζόν όσο και στην επιλογή των feature για κάθε classifier αλλά και σεζόν. Τέλος χρησιμοποιούνται 4 βασικοί αλγόριθμοι εκμάθησης και όλα τα στοιχεία είναι διαθέσιμα σε πραγματικό χρόνο. Το τελευταίο αναφέρεται στο ότι για οποιονδήποτε αγώνα πάντα χρησιμοποιούνται στοιχεία τα οποία έχουν ήδη λάβει μέρος την συγκεκριμένη στιγμή και ποτέ αποτελέσματα της παρούσας χρονικής στιγμής, όπως χρησιμοποιούν άλλες προσεγγίσεις που προσπαθούν να κάνουν ανάλογη πρόβλεψη για να φέρουν καλύτερα αποτελέσματα. Η πρόβλεψη είναι ρεαλιστική καθώς χρησιμοποιεί δεδομένα για τα οποία υπάρχει δυνατότητα γνώσης την χρονική στιγμή της πρόβλεψης.
|