Predicting Greek high growth firms using machine learning methods

The asymmetric outcomes of firms’ performance due to conceptual heterogeneities have considerably drawn the attention of scientific community. The aim of this dissertation is to detect what determines high-growth firms (HGFs). A random forest approach is then used to predict whether a Greek firm...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κωστοπούλου, Αλεξάνδρα
Άλλοι συγγραφείς: Kostopoulou, Alexandra
Γλώσσα:English
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15532
id nemertes-10889-15532
record_format dspace
institution UPatras
collection Nemertes
language English
topic Forecasting
High-growth firms
Low-growth firms
Random forest al gorithm
Variable Importance
Πρόβλεψη
Σημαντικότητα μεταβλητής
Αλγόριθμος τυχαίων δασών
Επιχειρήσεις χαμηλής μεγέθυνσης
Επιχειρήσεις χαμηλής μεγέθυνσης
spellingShingle Forecasting
High-growth firms
Low-growth firms
Random forest al gorithm
Variable Importance
Πρόβλεψη
Σημαντικότητα μεταβλητής
Αλγόριθμος τυχαίων δασών
Επιχειρήσεις χαμηλής μεγέθυνσης
Επιχειρήσεις χαμηλής μεγέθυνσης
Κωστοπούλου, Αλεξάνδρα
Predicting Greek high growth firms using machine learning methods
description The asymmetric outcomes of firms’ performance due to conceptual heterogeneities have considerably drawn the attention of scientific community. The aim of this dissertation is to detect what determines high-growth firms (HGFs). A random forest approach is then used to predict whether a Greek firm will be HGF in three periods ahead, i.e 2018, given current period’s information, that is 2015. To this end a database from ICAP which includes 91999 cases of Greek firms between 2005-2018 is employed. HGFs dummies which constitute the dependent variables are defined by two indices, founded on OECD-Eurostat’s and Birch’s definitions of HGFs. The set of explanatory variables includes firms’ financial indicators, age, sector of economic activity and region. Main results of the study suggest that Greek firms principally consist of LGFs between 2009-2018, while intense declines in the number of HGFs imply the weak sustainability of Greek HGFs. It is further inferred that HGFs are younger and LGFs older. The results of Birch Index manifest that random forest accurately predicts 16.8 % of HGFs. Instead, True Positive Rate entails that random forest tends to classify firms as LGFs. Besides, OECD-Eurostat results suggest that random forest fails to predict HGFs, whilst accurately predicts LGFs. The prediction of HGFs is heavily dependent on firm’s size which is captured by the Total Assets and its growth variables. Finally, most of the significant predictors of HGFs correspond to financial aggregates and firm’s age.
author2 Kostopoulou, Alexandra
author_facet Kostopoulou, Alexandra
Κωστοπούλου, Αλεξάνδρα
author Κωστοπούλου, Αλεξάνδρα
author_sort Κωστοπούλου, Αλεξάνδρα
title Predicting Greek high growth firms using machine learning methods
title_short Predicting Greek high growth firms using machine learning methods
title_full Predicting Greek high growth firms using machine learning methods
title_fullStr Predicting Greek high growth firms using machine learning methods
title_full_unstemmed Predicting Greek high growth firms using machine learning methods
title_sort predicting greek high growth firms using machine learning methods
publishDate 2021
url http://hdl.handle.net/10889/15532
work_keys_str_mv AT kōstopouloualexandra predictinggreekhighgrowthfirmsusingmachinelearningmethods
AT kōstopouloualexandra problepsēellēnikōnepicheirēseōnanaptyxēsmetēchrēsēmethodōnmēchanikēsmathēsēs
_version_ 1771297239783702528
spelling nemertes-10889-155322022-09-05T13:58:36Z Predicting Greek high growth firms using machine learning methods Πρόβλεψη ελληνικών επιχειρήσεων ανάπτυξης με τη χρήση μεθόδων μηχανικής μάθησης Κωστοπούλου, Αλεξάνδρα Kostopoulou, Alexandra Forecasting High-growth firms Low-growth firms Random forest al gorithm Variable Importance Πρόβλεψη Σημαντικότητα μεταβλητής Αλγόριθμος τυχαίων δασών Επιχειρήσεις χαμηλής μεγέθυνσης Επιχειρήσεις χαμηλής μεγέθυνσης The asymmetric outcomes of firms’ performance due to conceptual heterogeneities have considerably drawn the attention of scientific community. The aim of this dissertation is to detect what determines high-growth firms (HGFs). A random forest approach is then used to predict whether a Greek firm will be HGF in three periods ahead, i.e 2018, given current period’s information, that is 2015. To this end a database from ICAP which includes 91999 cases of Greek firms between 2005-2018 is employed. HGFs dummies which constitute the dependent variables are defined by two indices, founded on OECD-Eurostat’s and Birch’s definitions of HGFs. The set of explanatory variables includes firms’ financial indicators, age, sector of economic activity and region. Main results of the study suggest that Greek firms principally consist of LGFs between 2009-2018, while intense declines in the number of HGFs imply the weak sustainability of Greek HGFs. It is further inferred that HGFs are younger and LGFs older. The results of Birch Index manifest that random forest accurately predicts 16.8 % of HGFs. Instead, True Positive Rate entails that random forest tends to classify firms as LGFs. Besides, OECD-Eurostat results suggest that random forest fails to predict HGFs, whilst accurately predicts LGFs. The prediction of HGFs is heavily dependent on firm’s size which is captured by the Total Assets and its growth variables. Finally, most of the significant predictors of HGFs correspond to financial aggregates and firm’s age. Τα ασύμμετρα αποτελέσματα σχετικά με την αποδοτικότητα των επιχειρήσεων λόγω της ετερογένειας έχουν απασχολήσει σημαντικά την ερευνητική κοινότητα. Ο σκοπός αυτής της διπλωματικής εργασίας είναι να διακρίνει τους παράγοντες που καθορίζουν την υπόσταση των επιχειρήσεων υψηλής μεγέθυνσης. Επομένως χρησιμοποιείται ένας αλγόριθμος τυχαίων δασών, με σκοπό να προβλέψει την πιθανότητα μία Ελλη νική επιχείρηση να είναι υψηλής μεγέθυνσης τρεις χρονικούς ορίζοντες εμπρός, για το 2018, δοθέντων των πληροφοριών της τρέχουσας χρονικής περιόδου, δηλαδή το 2015. Για το λόγο αυτό χρησιμοποιείται μία βάση δεδομένων από την ICAP η οποία περιλαμβάνει πληροφορίες για 91999 επιχειρήσεις μεταξύ της περιόδου 2005-2018. Οι δυαδικές μεταβλητές της υψηλής μεγέθυνσης οι οποίες αποτελούν τις εξαρτημένες μεταβλητές, ορίζονται από δύο δείκτες βασιζόμενοι στους ορισμούς των ΟΟΣΑ Eurostat και -Birch . Το σύνολο των ερμηνευτικών μεταβλητών του υποδείγματος περιλαμβάνει στοιχεία από χρηματοοικονομικές μεταβλητές των επιχειρήσεων, την ηλικία, τον κλάδο οικονομικής δραστηριότητας τους και την περιφέρεια. Βασικά συμπεράσματα της εργασίας συνιστούν ότι οι Ελληνικές επιχειρήσεις αποτελούνται κυρίως από επιχειρήσεις χαμηλής μεγέθυνσης μεταξύ της περιόδου 2009-2018, ενώ υψηλές μειώσεις στον αριθμό των επιχειρήσεων υψηλής μεγέθυνσης υποδηλώνουν την χαμηλή βιωσιμότητα τους. Επιπλέον συμπεραίνεται ότι οι επιχειρήσεις υψηλής μεγέθυνσης είναι νεότερες και η χαμηλής μεγέθυνσης μεγαλύτερες ηλικιακά. Τα α ποτελέσματα από το δείκτη του Birch δείχνουν ότι ο αλγόριθμος τυχαίων δασών προβλέπει με ακρίβεια το 16.8 % των επιχειρήσεων υψηλής μεγέθυνσης. Ωστόσο το ποσοστό ορθώς θετικών αποτελεσμάτων συνεπάγεται ότι ο αλγόριθμος τυχαίων δασών τείνει να κατηγοριοποιεί με μεγαλύτερη πιθανότητα τις επιχειρήσεις χαμηλής μεγέθυνσης. Από την άλλη πλευρά, τα αποτελέσματα του δείκτη ΟΟΣΑ-Eurostat συνιστούν ότι ο αλγόριθμος τυχαίων δασών αποτυγχάνει πλήρως να προβλέψει τις επιχειρήσεις υψηλής μεγέθυνσης, ενώ προβλέπει με ακρίβεια τις χαμηλής μεγέθυνσης επιχειρήσεις. Η πρόβλεψη των επιχειρήσεων υψηλής μεγέθυνσης εξαρτάται σημαντι κά από το μέγεθος της επιχείρησης το οποίο αποτυπώνεται στα Συνολικά Κεφάλαια και στις μεταβλητές του ρυθμού μεταβολής τους. Τέλος από τις σημαντικές μεταβλητές των επιχειρήσεων υψηλής μεγέθυνσης οι περισσότερες εξ’ αυτών αντιστοιχούν σε χρηματοοικονομικά μεγέθη και την ηλικία της επιχείρησης. 2021-11-08T07:05:32Z 2021-11-08T07:05:32Z 2021-09 http://hdl.handle.net/10889/15532 en application/pdf