Σχεδιασμός και υλοποίηση μεθοδολογίας βραχυπρόθεσμης πρόβλεψης τιμών μετοχών του ελληνικού χρηματιστηρίου με συνδυασμό εξελικτικών αλγορίθμων, μηχανών διανυσμάτων υποστήριξης και τεχνικής κυλιόμενου παραθύρου

Οι περισσότερες παραδοσιακές μέθοδοι αλλά και οι πιο σύνθετες τεχνικές μηχανικής μάθησης έχουν αποτύχει στο να χειριστούν την πολυπλοκότητα και τις μη γραμμικότητες που υπάρχουν στις οικονομικές χρονοσειρές, ιδιαίτερα κατά τη διάρκεια της τελευταίας οικονομικής κρίσης. Στις παραδοσιακές μεθόδους μον...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τσαρμπόπουλος, Δημήτριος
Άλλοι συγγραφείς: Λυκοθανάσης, Σπυρίδων
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9436
Περιγραφή
Περίληψη:Οι περισσότερες παραδοσιακές μέθοδοι αλλά και οι πιο σύνθετες τεχνικές μηχανικής μάθησης έχουν αποτύχει στο να χειριστούν την πολυπλοκότητα και τις μη γραμμικότητες που υπάρχουν στις οικονομικές χρονοσειρές, ιδιαίτερα κατά τη διάρκεια της τελευταίας οικονομικής κρίσης. Στις παραδοσιακές μεθόδους μοντελοποίησης και πρόβλεψης έχουν εντοπιστεί μειονεκτήματα όπως: Δυσκολία στη ρύθμιση των παραμέτρων των αλγορίθμων, δυσκολία των γραμμικών μεθόδων να παρέχουν καλές προβλέψεις, το πρόβλημα της υπερεκπαίδευσης (overfitting) καθώς και το γεγονός ότι η μοντελοποίηση και η πρόβλεψη πολλές φορές θεωρούνται διαφορετικά προβλήματα. Τα μοντέλα που περιγράφουν τις οικονομικές χρονοσειρές δεν είναι στατικά στο χρόνο αλλά μεταβάλλονται συνεχώς, άρα οι παραδοσιακές τεχνικές οι οποίες προσπαθούσαν να βρουν ένα μοντέλο που να περιγράφει όλη την ιστορία της χρονοσειράς αποτυγχάνουν. Σκοπός της παρούσας διπλωματικής εργασίας είναι ο συνδυασμός Γενετικών Αλγορίθμων με Μηχανές Διανυσμάτων Υποστήριξης (Support Vector Machines - SVM) για την ειδική περίπτωση της Παλινδρόμησης (Regression). Οι Γενετικοί Αλγόριθμοι (Genetic Algorithms – GA’s) αποτελούν μια μέθοδο ευρετικής αναζήτησης που μιμείται τη φυσική επιλογή. Ανήκουν στην ευρύτερη περιοχή των Εξελικτικών Αλγορίθμων. Ψάχνουν για τη βέλτιστη λύση σε ένα πρόβλημα μέσα από μια αυτόματη διαδικασία. Οι Μηχανές Διανυσμάτων Υποστήριξης είναι μια μέθοδος που ανήκει στην κατηγορία των μοντέλων της επιβλεπόμενης μάθησης (supervised learning) και σήμερα θεωρείται καινοτόμος στο πεδίο της Μηχανικής Μάθησης. Στόχος τους είναι ο εντοπισμός του βέλτιστου υπερεπιπέδου το οποίο μπορεί να ταξινομήσει τα σημεία σε κατηγορίες (classification) και το οποίο παρουσιάζει τη μεγαλύτερη απόσταση μεταξύ των σημείων των διαφορετικών κατηγοριών. Η υποπερίπτωση της Παλινδρόμησης Διανυσμάτων Υποστήριξης (Support Vector Regression, SVR) πηγαίνει τη διαδικασία της κατηγοριοποίησης ένα βήμα παραπέρα, προσπαθώντας να προβλέψει με όσο το δυνατόν μεγαλύτερη ακρίβεια τις εξόδους κάποιας συνάρτησης (εξαρτημένες μεταβλητές) σε συνάρτηση με τις μεταβλητές εισόδου της (ανεξάρτητες μεταβλητές). Οι SVM αποτελούν γενικού σκοπού κατηγοριοποιητές και δε χρειάζονται εκ των προτέρων γνώση. Παρά το ισχυρό τους θεωρητικό υπόβαθρο και τα υποσχόμενα πειραματικά τους αποτελέσματα, δεν έχουν ακόμα καταφέρει να ξεπεράσουν τα εμπόδια της κατάρας της διαστασιμότητας (curse of dimensionality) και της ρύθμισης των παραμέτρων τους. Για το λόγο αυτό, σε αρκετές περιπτώσεις, απλά νευρωνικά δίκτυα, τους έχουν ξεπεράσει σε απόδοση. Οι GAs από την άλλη, έχουν εφαρμοστεί ευρέως για την προηγμένη διαχείριση χαρτοφυλακίου και για την επίλυση προβλημάτων στην κατανομή των επενδύσεων [1]. Οι Μηχανές Διανυσμάτων Υποστήριξης έχουν ήδη εφαρμοστεί σε πολλές εφαρμογές πρόβλεψης και κατηγοριοποίησης - παλινδόμησης στο πεδίο των χρηματοοικονομικών [2, 3]. Ωστόσο ακόμη απέχουν από το να καθιερωθούν στο πεδίο της πρόβλεψης των οικονομικών χρονοσειρών. Ο Γενετικός Αλγόριθμος [4,5] που υλοποιήθηκε στην παρούσα εργασία έχει βελτιωθεί χρησιμοποιώντας δεκαδική κωδικοποίηση στα χρωμοσώματα αντί για την κλασική δυαδική (binary). Ακόμα, γίνεται χρήση επιλογής βαθμονόμησης (rank based selection) κατά την επιλογή των ατόμων που επιλέγονται να περάσουν στην επόμενη γενιά. H μέθοδος αυτή μειώνει την πίεση της επιλογής όταν η διασπορά των τιμών της συνάρτησης κόστους είναι μεγάλη και την αυξάνει σε αντίθετη περίπτωση. Ως κριτήριο τερματισμού χρησιμοποιείται ο μέγιστος αριθμός γενεών εκτέλεσης του αλγορίθμου. Λόγω της μη στάσιμης φύσης της αγοράς και της συνεχούς εξέλιξής της, εφαρμόσαμε την τεχνική του κυλιόμενου παραθύρου (sliding window) στα δεδομένα μας. Ο Γενετικός Αλγόριθμος που υλοποιήθηκε, επιλέγει ποιες χρονοσειρές και σε ποιο βαθμό επηρεάζουν τη χρονοσειρά που προβλέπουμε. Ακόμα, μέσω του αλγορίθμου γίνεται επιλογή των καλύτερων τιμών της (παράμετρος κανονικοποίησης) και της τιμής (παράμετρος της γκαουσιανής συνάρτησης πυρήνα), που αποτελούν παραμέτρους των μηχανών διανυσμάτων υποστήριξης. Κρίνεται αναγκαίο να βελτιστοποιήσουμε τις δύο αυτές τιμές αφού η παράμετρος ορίζει το ισοζύγιο μεταξύ πολυπλοκότητας και απόδοσης από τη μια και από την άλλη, τις περισσότερες φορές τα δεδομένα δεν είναι γραμμικώς διαχωρίσιμα, οπότε θα πρέπει να χρησιμοποιηθεί μια συνάρτηση πυρήνα (σωστά ρυθμισμένη) για την εκτέλεση του μοντέλου. Για το Γενετικό Αλγόριθμο σχεδιάστηκε μία εξειδικευμένη Συνάρτηση Καταλληλόλητας ή αλλιώς Αντικειμενική Συνάρτηση (Objective ή Fitness Function) για να ενσωματώνει τη βελτιστοποίηση μετρικών που είναι εξειδικευμένες στην αξιολόγηση επενδυτικών στρατηγικών (όπως για παράδειγμα το ετήσιο κέρδος). Η προτεινόμενη μέθοδος χρησιμοποιήθηκε για την πρόβλεψη της τιμής των μετοχών της Εθνικής Τράπεζας της Ελλάδος (ΕΤΕ), της Τράπεζας Πειραιώς (ΠΕΙΡ), του Οργανισμού Προγνωστικών Αγώνων Ποδοσφαίρου (ΟΠΑΠ), του Οργανισμού Τηλεπικοινωνιών Ελλάδος (ΟΤΕ) και της εταιρίας ΙΝΤΡΑΛΟΤ (ΙΝΛΟΤ), που είναι όλες εισηγμένες στο Χρηματιστήριο Αξιών Αθηνών (ΧΑΑ). Η προτεινόμενη μέθοδος συγκρίνεται με την παραδοσιακή μέθοδο αποτίμησης χρηματιστηριακών τιμών Buy & Hold και με τον κλασσικό Αλγόριθμο Παλινδρόμησης Διανυσμάτων Υποστήριξης (SVR) χωρίς τη χρήση Γενετικών. Για καλύτερο διαχωρισμό των μεθόδων για το υπόλοιπο της παρούσας εργασίας, η προτεινόμενη μεθοδολογία θα αναφέρεται ως GA-SVR.