Data mining στην πρόβλεψη του τραπεζικού κινδύνου
Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/12928 |
id |
nemertes-10889-12928 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Εξόρυξη δεδομένων Τραπεζικός κίνδυνος Ρευστότητα Data mining Bank risk |
spellingShingle |
Εξόρυξη δεδομένων Τραπεζικός κίνδυνος Ρευστότητα Data mining Bank risk Κούκος, Ευστράτιος Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
description |
Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των νεότερων μεθόδων, οι οποίες τελικά μπορούν να παράγουν καλύτερα αποτελέσματα.
Ειδικάσεοικονομικάδεδομέναόπωςταδάνειαοιερευνητέςεστιάζουνστονεντοπισμότου καλύτερουμοντέλουγιατηνπρόβλεψηςαθέτησηςπληρωμώνμέσααπόδιαθέσιμαστοιχεία χρηματοπιστωτικώνιδρυμάτων.
Βασικά ερωτήματα που δημιουργούνται λοιπόν είναι ο όγκος δεδομένων που θα χρειαστούμε και ταυτόχρονα θα μπορούμε να διαχειριστούμε για την χρήση των μοντέλων μας , τα είδη μοντέλων που είναι διαθέσιμα για την πρόβλεψη οικονομικών μεγεθών όπως η αθέτηση ενός δανείου, τα χαρακτηριστικά που πρέπει να γνωρίζουμε όπου με βάση αυτά θα γίνεται ο χαρακτηρισμός.
Ο πιστωτικός κίνδυνος αποτελεί τον σημαντικότερο κίνδυνο για τα χρηματοπιστωτικά ιδρύματα όσο και για οργανισμούς και εμφανίζεται με την απώλεια μιας χρηματικής αμοιβής ενός επενδυτή που οφείλεται στην αδυναμία εκπλήρωσης των υποχρεώσεων του αντισυμβαλλόμενου έναντι του οποίου υπάρχει απαίτηση . Είναι συνδεδεμένος στενά με τις υπηρεσίες εμπορικής τραπεζικής γι’ αυτό το λόγο συνδέεται με την πιστοληπτική ικανότητα των αντισυμβαλλόμενων του πιστωτικού ιδρύματος, γι’ αυτό το λόγο χαρακτηρίζεταιωςοσημαντικότεροςτόσοποσοτικάόσοκαιποιοτικάχρηματοοικονομικής φύσης κίνδυνος . Όσον αφορά τις επιχειρήσεις όταν έρχονται αντιμέτωπες με αυτό το είδος κινδύνου, έχει ως επακόλουθο να περιοριστεί η ρευστότητα τους λόγω ότι μειώνεται η πιστοληπτική τους ικανότητα, κάτι που συχνά οδηγεί σεπτώχευση.
Έτσι αποτελεί πολύ σημαντικό στοιχείο η πρόβλεψη του πιστωτικού κινδύνου μέσα από σειράχαρακτηριστικώντουπελάτη.Ηδιαδικασίααυτήείναιιδιαίτεραπολύπλοκηαπότους υπαλλήλους ενός οργανισμού κι αυτό γιατί ο οργανισμός πρέπει να μπορεί και να προστατεύεται αλλά και να δανείζει αφού κερδίζει μέσω της διαδικασίας δανεισμού. Τα δε χαρακτηριστικά ενός πελάτη είναι αρκετά και ο συνδυασμός τους είναι αυτός που τελικά τον χαρακτηρίζει, γεγονός που κάνει έναν υπάλληλο να μην λειτουργεί με ασφάλεια και κυρίως τελικά να κοιτά τα μεγέθη στατικά και όχισυνδυαστικά.
Σήμερα οι τραπεζικοί οργανισμοί μπορούν να επιλέξουν μεταξύ δύο προσεγγίσεων για τον καθορισμότωνκεφαλαιακώναπαιτήσεωντουπιστωτικούκινδύνου μιατυποποιημένη προσέγγισηπουβασίζεταισεαξιολογήσειςπουαποδίδονταιαπόεξωτερικούςοργανισμούς για περιουσιακά στοιχεία ή σε μια προσέγγιση εσωτερικής διαβάθμισης (IRB) στην οποία τα ιδρύματα μπορούν να εφαρμόζουν τα δικά τους εσωτερικά υποδείγματα για τον υπολογισμό των κεφαλαιακών απαιτήσεων του πιστωτικού κινδύνου. Οι τράπεζες που υιοθετούν την προσέγγισης IRB αναμένεται να παρέχουν εκτιμήσεις για τη ζημία που οφείλεται σε αδυναμίαπληρωμής.
Αυτό επιβάλλει τη χρήση οικονομετρικών τεχνικών που λαμβάνουν υπόψη τον οριοθετημένο χαρακτήρα των ποσοστών ανάκτησης. Εμπειρικές μελέτες δείχνουν ότι δεν είναι εύκολο να βρεθούν επεξηγηματικές μεταβλητές που επηρεάζουν έντονα τα ποσοστά ανάκτησης.
Ηπιοαπλήτεχνικήγιατηνανάκτησημοντέλωνείναιηγραμμικήπαλινδρόμησηδηλαδήτο κλασσικό μοντέλο που υπολογίζεται με τις συνήθεις μεθόδους ελαχίστων τετραγώνων. Η προσέγγιση χρησιμοποιείται στο Casellietal. (2008), Davydenko και Franks (2008) και Grunert και Weber (2009). Ωστόσο, η μοντελοποίηση και η πρόβλεψη ανακτήσεων με ένα γραμμικό μοντέλο έχει σοβαρούς περιορισμούς. Πρώτον, επειδή η υποστήριξη του γραμμικούμοντέλουδενεξασφαλίζειότιοιπροβλεπόμενεςτιμέςακολουθούνκαιγραμμική λογική και επίσης, δεδομένης της οριοθετημένης φύσης της εξαρτώμενης μεταβλητής, η μερική επίδραση οποιασδήποτε επεξηγηματικής μεταβλητής δεν μπορεί να είναισταθερή.
Αυτοί οι περιορισμοί μπορούν να ξεπεραστούν χρησιμοποιώντας μια οικονομετρική μεθοδολογία ειδικά σχεδιασμένη για αναλογίες μοντελοποίησης, όπως η (μη γραμμική) κλασματική παλινδρόμηση που υπολογίζεται χρησιμοποιώντας μεθόδους ολικής πιθανότητας (Papke and Wooldridge,1996). Στο πλαίσιο των πιστωτικών απωλειών, η προσέγγιση αυτή υιοθετήθηκε από την Dermine και τη Neto de Carvalho (2006) και Chalupka και Kopecsni (2009).
Μια εναλλακτική διαδικασία είναι η εφαρμογή της παλινδρόμησης σε κατάλληλα μετασχηματισμένες ανακτήσεις. Το πιο χαρακτηριστικό παράδειγμα αυτής της τεχνικής είναι το Moody'sLossCalcGupton and Stein το 2005, στο οποίο οι ανακτήσεις κανονικοποιούνται μέσω μιας βήτα κατανομής και πραγματοποιείται μια γραμμική παλινδρόμηση στο μετασχηματισμένο σύνολο δεδομένων. Μια ξεχωριστή προσέγγιση προσφέρεται από μη παραμετρικά μοντέλα, στα οποίο η λειτουργική μορφή για τον μέσον
όρο της μεταβλητής απόκρισης δεν είναι προκαθορισμένη από τον ερευνητή αλλά προέρχεται από τις πληροφορίες που παρέχονται από τα δεδομένα.
Έτσι ο Bastos (2010) πρότεινε τη χρήση μη παραμετρικών δέντρων παλινδρόμησης για μοντελοποίηση ανακτήσεις των τραπεζικών δανείων. Το πλεονέκτημα αυτής της τεχνικής είναι η ερμηνεία της, αφού ένα δεντρικό μοντέλο μοιάζει με ένα σύστημα αναζήτησης που περιέχειιστορικούςμέσουςόρουςανάκτησης.Επίπλέον,επειδήοιπροβλέψειςδίδονταιαπό τους μέσους όρους ανάκτησης, είναι αναπόφευκτα περιορισμένες στο διάστημαμονάδων.
Επίσης εργασίες εφάρμοσαν τεχνητά νευρωνικά δικτύων για την πρόβλεψη ανακτήσεων τραπεζικών δανείων. Ένα τεχνητό νευρωνικό δίκτυο είναι μη παραμετρικό μαθηματικό μοντέλο που επιχειρεί να μιμηθεί τη λειτουργία των βιολογικών νευρωνικώνδικτύων.Αποτελείταιαπόμιαομάδαδιασυνδεδεμένωνμονάδωνεπεξεργασίας που χαρακτηρίζονται από νευρώνες. Λόγω στην καλή τους ικανότητα να προσεγγίζουν αυθαίρετες σύνθετες λειτουργίες, τα νευρωνικά δίκτυα έχουν εφαρμοστεί σε ένα ευρύ φάσμα επιστημονικώντομέων.
Συγκεκριμένα,νευρωνικάδίκτυαέχουνχρησιμοποιηθείμεεπιτυχίαστημοντελοποίησητης πιθανότητας αθέτησης (βλέπε π.χ. Altmanetal., 1994), η οποία, μαζί με το ρυθμό ανάκαμψης, καθορίζει την αναμενόμενη πιστωτική ζημιά σε ένα χρηματοοικονομικό περιουσιακό στοιχείο. Σε αυτή τη μελέτη, τα νευρικά δίκτυα εκπαιδεύονται για να αναγνωρίσουν και να μάθουν από μια σειρά δεδομένων τα ποσοστά των τραπεζικών δανείων που βρίσκονται σε αδυναμίαπληρωμής.
Η παρούσα διπλωματική εργασία εκπονήθηκε κατά τη διάρκεια του ακαδημαϊκού έτους 2018-2019 στο τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής, του ΠανεπιστημίουΠατρών,υπότηνεπίβλεψητουΚαθηγητή,κ.ΓεώργιοΠαυλίδη.Στόχοςτης διπλωματικής αυτής είναι η πρόβλεψη του πιστωτικού κινδύνου με χρήση των χαρακτηριστικών του δανειολήπτη. Για να γίνει αυτό σχεδιάζονται μοντέλα και εφαρμόζονταιόπωςνευρωνικάδίκτυα,δέντρααποφάσεως,μοντέλαπαλινδρόμησηςκ.α.Τα δεδομένα αντλήθηκαν από τον διαδικτυακό τόπο του επιστημονικού βιβλίου «CreditRiskAnalytics»,έναβιβλίοπουσυνιστάοδηγόπρακτικήςεφαρμογήςκαιμοντελοποίησηςειδικά για την διαχείριση και πρόβλεψη του ΠιστωτικούΚινδύνου. |
author2 |
Παυλίδης, Γεώργιος |
author_facet |
Παυλίδης, Γεώργιος Κούκος, Ευστράτιος |
format |
Thesis |
author |
Κούκος, Ευστράτιος |
author_sort |
Κούκος, Ευστράτιος |
title |
Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
title_short |
Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
title_full |
Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
title_fullStr |
Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
title_full_unstemmed |
Data mining στην πρόβλεψη του τραπεζικού κινδύνου |
title_sort |
data mining στην πρόβλεψη του τραπεζικού κινδύνου |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/12928 |
work_keys_str_mv |
AT koukoseustratios dataminingstēnproblepsētoutrapezikoukindynou AT koukoseustratios dataminingonpredictingbankrisk |
_version_ |
1799945014228287488 |
spelling |
nemertes-10889-129282022-09-06T07:03:52Z Data mining στην πρόβλεψη του τραπεζικού κινδύνου Data mining on predicting bank risk Κούκος, Ευστράτιος Παυλίδης, Γεώργιος Koukos, Eystratios Τσώλης, Δημήτριος Εξόρυξη δεδομένων Τραπεζικός κίνδυνος Ρευστότητα Data mining Bank risk Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των νεότερων μεθόδων, οι οποίες τελικά μπορούν να παράγουν καλύτερα αποτελέσματα. Ειδικάσεοικονομικάδεδομέναόπωςταδάνειαοιερευνητέςεστιάζουνστονεντοπισμότου καλύτερουμοντέλουγιατηνπρόβλεψηςαθέτησηςπληρωμώνμέσααπόδιαθέσιμαστοιχεία χρηματοπιστωτικώνιδρυμάτων. Βασικά ερωτήματα που δημιουργούνται λοιπόν είναι ο όγκος δεδομένων που θα χρειαστούμε και ταυτόχρονα θα μπορούμε να διαχειριστούμε για την χρήση των μοντέλων μας , τα είδη μοντέλων που είναι διαθέσιμα για την πρόβλεψη οικονομικών μεγεθών όπως η αθέτηση ενός δανείου, τα χαρακτηριστικά που πρέπει να γνωρίζουμε όπου με βάση αυτά θα γίνεται ο χαρακτηρισμός. Ο πιστωτικός κίνδυνος αποτελεί τον σημαντικότερο κίνδυνο για τα χρηματοπιστωτικά ιδρύματα όσο και για οργανισμούς και εμφανίζεται με την απώλεια μιας χρηματικής αμοιβής ενός επενδυτή που οφείλεται στην αδυναμία εκπλήρωσης των υποχρεώσεων του αντισυμβαλλόμενου έναντι του οποίου υπάρχει απαίτηση . Είναι συνδεδεμένος στενά με τις υπηρεσίες εμπορικής τραπεζικής γι’ αυτό το λόγο συνδέεται με την πιστοληπτική ικανότητα των αντισυμβαλλόμενων του πιστωτικού ιδρύματος, γι’ αυτό το λόγο χαρακτηρίζεταιωςοσημαντικότεροςτόσοποσοτικάόσοκαιποιοτικάχρηματοοικονομικής φύσης κίνδυνος . Όσον αφορά τις επιχειρήσεις όταν έρχονται αντιμέτωπες με αυτό το είδος κινδύνου, έχει ως επακόλουθο να περιοριστεί η ρευστότητα τους λόγω ότι μειώνεται η πιστοληπτική τους ικανότητα, κάτι που συχνά οδηγεί σεπτώχευση. Έτσι αποτελεί πολύ σημαντικό στοιχείο η πρόβλεψη του πιστωτικού κινδύνου μέσα από σειράχαρακτηριστικώντουπελάτη.Ηδιαδικασίααυτήείναιιδιαίτεραπολύπλοκηαπότους υπαλλήλους ενός οργανισμού κι αυτό γιατί ο οργανισμός πρέπει να μπορεί και να προστατεύεται αλλά και να δανείζει αφού κερδίζει μέσω της διαδικασίας δανεισμού. Τα δε χαρακτηριστικά ενός πελάτη είναι αρκετά και ο συνδυασμός τους είναι αυτός που τελικά τον χαρακτηρίζει, γεγονός που κάνει έναν υπάλληλο να μην λειτουργεί με ασφάλεια και κυρίως τελικά να κοιτά τα μεγέθη στατικά και όχισυνδυαστικά. Σήμερα οι τραπεζικοί οργανισμοί μπορούν να επιλέξουν μεταξύ δύο προσεγγίσεων για τον καθορισμότωνκεφαλαιακώναπαιτήσεωντουπιστωτικούκινδύνου μιατυποποιημένη προσέγγισηπουβασίζεταισεαξιολογήσειςπουαποδίδονταιαπόεξωτερικούςοργανισμούς για περιουσιακά στοιχεία ή σε μια προσέγγιση εσωτερικής διαβάθμισης (IRB) στην οποία τα ιδρύματα μπορούν να εφαρμόζουν τα δικά τους εσωτερικά υποδείγματα για τον υπολογισμό των κεφαλαιακών απαιτήσεων του πιστωτικού κινδύνου. Οι τράπεζες που υιοθετούν την προσέγγισης IRB αναμένεται να παρέχουν εκτιμήσεις για τη ζημία που οφείλεται σε αδυναμίαπληρωμής. Αυτό επιβάλλει τη χρήση οικονομετρικών τεχνικών που λαμβάνουν υπόψη τον οριοθετημένο χαρακτήρα των ποσοστών ανάκτησης. Εμπειρικές μελέτες δείχνουν ότι δεν είναι εύκολο να βρεθούν επεξηγηματικές μεταβλητές που επηρεάζουν έντονα τα ποσοστά ανάκτησης. Ηπιοαπλήτεχνικήγιατηνανάκτησημοντέλωνείναιηγραμμικήπαλινδρόμησηδηλαδήτο κλασσικό μοντέλο που υπολογίζεται με τις συνήθεις μεθόδους ελαχίστων τετραγώνων. Η προσέγγιση χρησιμοποιείται στο Casellietal. (2008), Davydenko και Franks (2008) και Grunert και Weber (2009). Ωστόσο, η μοντελοποίηση και η πρόβλεψη ανακτήσεων με ένα γραμμικό μοντέλο έχει σοβαρούς περιορισμούς. Πρώτον, επειδή η υποστήριξη του γραμμικούμοντέλουδενεξασφαλίζειότιοιπροβλεπόμενεςτιμέςακολουθούνκαιγραμμική λογική και επίσης, δεδομένης της οριοθετημένης φύσης της εξαρτώμενης μεταβλητής, η μερική επίδραση οποιασδήποτε επεξηγηματικής μεταβλητής δεν μπορεί να είναισταθερή. Αυτοί οι περιορισμοί μπορούν να ξεπεραστούν χρησιμοποιώντας μια οικονομετρική μεθοδολογία ειδικά σχεδιασμένη για αναλογίες μοντελοποίησης, όπως η (μη γραμμική) κλασματική παλινδρόμηση που υπολογίζεται χρησιμοποιώντας μεθόδους ολικής πιθανότητας (Papke and Wooldridge,1996). Στο πλαίσιο των πιστωτικών απωλειών, η προσέγγιση αυτή υιοθετήθηκε από την Dermine και τη Neto de Carvalho (2006) και Chalupka και Kopecsni (2009). Μια εναλλακτική διαδικασία είναι η εφαρμογή της παλινδρόμησης σε κατάλληλα μετασχηματισμένες ανακτήσεις. Το πιο χαρακτηριστικό παράδειγμα αυτής της τεχνικής είναι το Moody'sLossCalcGupton and Stein το 2005, στο οποίο οι ανακτήσεις κανονικοποιούνται μέσω μιας βήτα κατανομής και πραγματοποιείται μια γραμμική παλινδρόμηση στο μετασχηματισμένο σύνολο δεδομένων. Μια ξεχωριστή προσέγγιση προσφέρεται από μη παραμετρικά μοντέλα, στα οποίο η λειτουργική μορφή για τον μέσον όρο της μεταβλητής απόκρισης δεν είναι προκαθορισμένη από τον ερευνητή αλλά προέρχεται από τις πληροφορίες που παρέχονται από τα δεδομένα. Έτσι ο Bastos (2010) πρότεινε τη χρήση μη παραμετρικών δέντρων παλινδρόμησης για μοντελοποίηση ανακτήσεις των τραπεζικών δανείων. Το πλεονέκτημα αυτής της τεχνικής είναι η ερμηνεία της, αφού ένα δεντρικό μοντέλο μοιάζει με ένα σύστημα αναζήτησης που περιέχειιστορικούςμέσουςόρουςανάκτησης.Επίπλέον,επειδήοιπροβλέψειςδίδονταιαπό τους μέσους όρους ανάκτησης, είναι αναπόφευκτα περιορισμένες στο διάστημαμονάδων. Επίσης εργασίες εφάρμοσαν τεχνητά νευρωνικά δικτύων για την πρόβλεψη ανακτήσεων τραπεζικών δανείων. Ένα τεχνητό νευρωνικό δίκτυο είναι μη παραμετρικό μαθηματικό μοντέλο που επιχειρεί να μιμηθεί τη λειτουργία των βιολογικών νευρωνικώνδικτύων.Αποτελείταιαπόμιαομάδαδιασυνδεδεμένωνμονάδωνεπεξεργασίας που χαρακτηρίζονται από νευρώνες. Λόγω στην καλή τους ικανότητα να προσεγγίζουν αυθαίρετες σύνθετες λειτουργίες, τα νευρωνικά δίκτυα έχουν εφαρμοστεί σε ένα ευρύ φάσμα επιστημονικώντομέων. Συγκεκριμένα,νευρωνικάδίκτυαέχουνχρησιμοποιηθείμεεπιτυχίαστημοντελοποίησητης πιθανότητας αθέτησης (βλέπε π.χ. Altmanetal., 1994), η οποία, μαζί με το ρυθμό ανάκαμψης, καθορίζει την αναμενόμενη πιστωτική ζημιά σε ένα χρηματοοικονομικό περιουσιακό στοιχείο. Σε αυτή τη μελέτη, τα νευρικά δίκτυα εκπαιδεύονται για να αναγνωρίσουν και να μάθουν από μια σειρά δεδομένων τα ποσοστά των τραπεζικών δανείων που βρίσκονται σε αδυναμίαπληρωμής. Η παρούσα διπλωματική εργασία εκπονήθηκε κατά τη διάρκεια του ακαδημαϊκού έτους 2018-2019 στο τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής, του ΠανεπιστημίουΠατρών,υπότηνεπίβλεψητουΚαθηγητή,κ.ΓεώργιοΠαυλίδη.Στόχοςτης διπλωματικής αυτής είναι η πρόβλεψη του πιστωτικού κινδύνου με χρήση των χαρακτηριστικών του δανειολήπτη. Για να γίνει αυτό σχεδιάζονται μοντέλα και εφαρμόζονταιόπωςνευρωνικάδίκτυα,δέντρααποφάσεως,μοντέλαπαλινδρόμησηςκ.α.Τα δεδομένα αντλήθηκαν από τον διαδικτυακό τόπο του επιστημονικού βιβλίου «CreditRiskAnalytics»,έναβιβλίοπουσυνιστάοδηγόπρακτικήςεφαρμογήςκαιμοντελοποίησηςειδικά για την διαχείριση και πρόβλεψη του ΠιστωτικούΚινδύνου. The way we can use algorithms to predict a bank risk and the most efficient of them.The banking system.Data Mining and banks.Opinion mining and sentimental analysis.Models with which we can evaluate credit risk.Bank risk categories. 2020-01-14T16:32:34Z 2020-01-14T16:32:34Z 2019-08-24 Thesis http://hdl.handle.net/10889/12928 gr 6 application/pdf |