Data mining στην πρόβλεψη του τραπεζικού κινδύνου

Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κούκος, Ευστράτιος
Άλλοι συγγραφείς: Παυλίδης, Γεώργιος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/12928
id nemertes-10889-12928
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Εξόρυξη δεδομένων
Τραπεζικός κίνδυνος
Ρευστότητα
Data mining
Bank risk
spellingShingle Εξόρυξη δεδομένων
Τραπεζικός κίνδυνος
Ρευστότητα
Data mining
Bank risk
Κούκος, Ευστράτιος
Data mining στην πρόβλεψη του τραπεζικού κινδύνου
description Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των νεότερων μεθόδων, οι οποίες τελικά μπορούν να παράγουν καλύτερα αποτελέσματα. Ειδικάσεοικονομικάδεδομέναόπωςταδάνειαοιερευνητέςεστιάζουνστονεντοπισμότου καλύτερουμοντέλουγιατηνπρόβλεψηςαθέτησηςπληρωμώνμέσααπόδιαθέσιμαστοιχεία χρηματοπιστωτικώνιδρυμάτων. Βασικά ερωτήματα που δημιουργούνται λοιπόν είναι ο όγκος δεδομένων που θα χρειαστούμε και ταυτόχρονα θα μπορούμε να διαχειριστούμε για την χρήση των μοντέλων μας , τα είδη μοντέλων που είναι διαθέσιμα για την πρόβλεψη οικονομικών μεγεθών όπως η αθέτηση ενός δανείου, τα χαρακτηριστικά που πρέπει να γνωρίζουμε όπου με βάση αυτά θα γίνεται ο χαρακτηρισμός. Ο πιστωτικός κίνδυνος αποτελεί τον σημαντικότερο κίνδυνο για τα χρηματοπιστωτικά ιδρύματα όσο και για οργανισμούς και εμφανίζεται με την απώλεια μιας χρηματικής αμοιβής ενός επενδυτή που οφείλεται στην αδυναμία εκπλήρωσης των υποχρεώσεων του αντισυμβαλλόμενου έναντι του οποίου υπάρχει απαίτηση . Είναι συνδεδεμένος στενά με τις υπηρεσίες εμπορικής τραπεζικής γι’ αυτό το λόγο συνδέεται με την πιστοληπτική ικανότητα των αντισυμβαλλόμενων του πιστωτικού ιδρύματος, γι’ αυτό το λόγο χαρακτηρίζεταιωςοσημαντικότεροςτόσοποσοτικάόσοκαιποιοτικάχρηματοοικονομικής φύσης κίνδυνος . Όσον αφορά τις επιχειρήσεις όταν έρχονται αντιμέτωπες με αυτό το είδος κινδύνου, έχει ως επακόλουθο να περιοριστεί η ρευστότητα τους λόγω ότι μειώνεται η πιστοληπτική τους ικανότητα, κάτι που συχνά οδηγεί σεπτώχευση. Έτσι αποτελεί πολύ σημαντικό στοιχείο η πρόβλεψη του πιστωτικού κινδύνου μέσα από σειράχαρακτηριστικώντουπελάτη.Ηδιαδικασίααυτήείναιιδιαίτεραπολύπλοκηαπότους υπαλλήλους ενός οργανισμού κι αυτό γιατί ο οργανισμός πρέπει να μπορεί και να προστατεύεται αλλά και να δανείζει αφού κερδίζει μέσω της διαδικασίας δανεισμού. Τα δε χαρακτηριστικά ενός πελάτη είναι αρκετά και ο συνδυασμός τους είναι αυτός που τελικά τον χαρακτηρίζει, γεγονός που κάνει έναν υπάλληλο να μην λειτουργεί με ασφάλεια και κυρίως τελικά να κοιτά τα μεγέθη στατικά και όχισυνδυαστικά. Σήμερα οι τραπεζικοί οργανισμοί μπορούν να επιλέξουν μεταξύ δύο προσεγγίσεων για τον καθορισμότωνκεφαλαιακώναπαιτήσεωντουπιστωτικούκινδύνου μιατυποποιημένη προσέγγισηπουβασίζεταισεαξιολογήσειςπουαποδίδονταιαπόεξωτερικούςοργανισμούς για περιουσιακά στοιχεία ή σε μια προσέγγιση εσωτερικής διαβάθμισης (IRB) στην οποία τα ιδρύματα μπορούν να εφαρμόζουν τα δικά τους εσωτερικά υποδείγματα για τον υπολογισμό των κεφαλαιακών απαιτήσεων του πιστωτικού κινδύνου. Οι τράπεζες που υιοθετούν την προσέγγισης IRB αναμένεται να παρέχουν εκτιμήσεις για τη ζημία που οφείλεται σε αδυναμίαπληρωμής. Αυτό επιβάλλει τη χρήση οικονομετρικών τεχνικών που λαμβάνουν υπόψη τον οριοθετημένο χαρακτήρα των ποσοστών ανάκτησης. Εμπειρικές μελέτες δείχνουν ότι δεν είναι εύκολο να βρεθούν επεξηγηματικές μεταβλητές που επηρεάζουν έντονα τα ποσοστά ανάκτησης. Ηπιοαπλήτεχνικήγιατηνανάκτησημοντέλωνείναιηγραμμικήπαλινδρόμησηδηλαδήτο κλασσικό μοντέλο που υπολογίζεται με τις συνήθεις μεθόδους ελαχίστων τετραγώνων. Η προσέγγιση χρησιμοποιείται στο Casellietal. (2008), Davydenko και Franks (2008) και Grunert και Weber (2009). Ωστόσο, η μοντελοποίηση και η πρόβλεψη ανακτήσεων με ένα γραμμικό μοντέλο έχει σοβαρούς περιορισμούς. Πρώτον, επειδή η υποστήριξη του γραμμικούμοντέλουδενεξασφαλίζειότιοιπροβλεπόμενεςτιμέςακολουθούνκαιγραμμική λογική και επίσης, δεδομένης της οριοθετημένης φύσης της εξαρτώμενης μεταβλητής, η μερική επίδραση οποιασδήποτε επεξηγηματικής μεταβλητής δεν μπορεί να είναισταθερή. Αυτοί οι περιορισμοί μπορούν να ξεπεραστούν χρησιμοποιώντας μια οικονομετρική μεθοδολογία ειδικά σχεδιασμένη για αναλογίες μοντελοποίησης, όπως η (μη γραμμική) κλασματική παλινδρόμηση που υπολογίζεται χρησιμοποιώντας μεθόδους ολικής πιθανότητας (Papke and Wooldridge,1996). Στο πλαίσιο των πιστωτικών απωλειών, η προσέγγιση αυτή υιοθετήθηκε από την Dermine και τη Neto de Carvalho (2006) και Chalupka και Kopecsni (2009). Μια εναλλακτική διαδικασία είναι η εφαρμογή της παλινδρόμησης σε κατάλληλα μετασχηματισμένες ανακτήσεις. Το πιο χαρακτηριστικό παράδειγμα αυτής της τεχνικής είναι το Moody'sLossCalcGupton and Stein το 2005, στο οποίο οι ανακτήσεις κανονικοποιούνται μέσω μιας βήτα κατανομής και πραγματοποιείται μια γραμμική παλινδρόμηση στο μετασχηματισμένο σύνολο δεδομένων. Μια ξεχωριστή προσέγγιση προσφέρεται από μη παραμετρικά μοντέλα, στα οποίο η λειτουργική μορφή για τον μέσον όρο της μεταβλητής απόκρισης δεν είναι προκαθορισμένη από τον ερευνητή αλλά προέρχεται από τις πληροφορίες που παρέχονται από τα δεδομένα. Έτσι ο Bastos (2010) πρότεινε τη χρήση μη παραμετρικών δέντρων παλινδρόμησης για μοντελοποίηση ανακτήσεις των τραπεζικών δανείων. Το πλεονέκτημα αυτής της τεχνικής είναι η ερμηνεία της, αφού ένα δεντρικό μοντέλο μοιάζει με ένα σύστημα αναζήτησης που περιέχειιστορικούςμέσουςόρουςανάκτησης.Επίπλέον,επειδήοιπροβλέψειςδίδονταιαπό τους μέσους όρους ανάκτησης, είναι αναπόφευκτα περιορισμένες στο διάστημαμονάδων. Επίσης εργασίες εφάρμοσαν τεχνητά νευρωνικά δικτύων για την πρόβλεψη ανακτήσεων τραπεζικών δανείων. Ένα τεχνητό νευρωνικό δίκτυο είναι μη παραμετρικό μαθηματικό μοντέλο που επιχειρεί να μιμηθεί τη λειτουργία των βιολογικών νευρωνικώνδικτύων.Αποτελείταιαπόμιαομάδαδιασυνδεδεμένωνμονάδωνεπεξεργασίας που χαρακτηρίζονται από νευρώνες. Λόγω στην καλή τους ικανότητα να προσεγγίζουν αυθαίρετες σύνθετες λειτουργίες, τα νευρωνικά δίκτυα έχουν εφαρμοστεί σε ένα ευρύ φάσμα επιστημονικώντομέων. Συγκεκριμένα,νευρωνικάδίκτυαέχουνχρησιμοποιηθείμεεπιτυχίαστημοντελοποίησητης πιθανότητας αθέτησης (βλέπε π.χ. Altmanetal., 1994), η οποία, μαζί με το ρυθμό ανάκαμψης, καθορίζει την αναμενόμενη πιστωτική ζημιά σε ένα χρηματοοικονομικό περιουσιακό στοιχείο. Σε αυτή τη μελέτη, τα νευρικά δίκτυα εκπαιδεύονται για να αναγνωρίσουν και να μάθουν από μια σειρά δεδομένων τα ποσοστά των τραπεζικών δανείων που βρίσκονται σε αδυναμίαπληρωμής. Η παρούσα διπλωματική εργασία εκπονήθηκε κατά τη διάρκεια του ακαδημαϊκού έτους 2018-2019 στο τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής, του ΠανεπιστημίουΠατρών,υπότηνεπίβλεψητουΚαθηγητή,κ.ΓεώργιοΠαυλίδη.Στόχοςτης διπλωματικής αυτής είναι η πρόβλεψη του πιστωτικού κινδύνου με χρήση των χαρακτηριστικών του δανειολήπτη. Για να γίνει αυτό σχεδιάζονται μοντέλα και εφαρμόζονταιόπωςνευρωνικάδίκτυα,δέντρααποφάσεως,μοντέλαπαλινδρόμησηςκ.α.Τα δεδομένα αντλήθηκαν από τον διαδικτυακό τόπο του επιστημονικού βιβλίου «CreditRiskAnalytics»,έναβιβλίοπουσυνιστάοδηγόπρακτικήςεφαρμογήςκαιμοντελοποίησηςειδικά για την διαχείριση και πρόβλεψη του ΠιστωτικούΚινδύνου.
author2 Παυλίδης, Γεώργιος
author_facet Παυλίδης, Γεώργιος
Κούκος, Ευστράτιος
format Thesis
author Κούκος, Ευστράτιος
author_sort Κούκος, Ευστράτιος
title Data mining στην πρόβλεψη του τραπεζικού κινδύνου
title_short Data mining στην πρόβλεψη του τραπεζικού κινδύνου
title_full Data mining στην πρόβλεψη του τραπεζικού κινδύνου
title_fullStr Data mining στην πρόβλεψη του τραπεζικού κινδύνου
title_full_unstemmed Data mining στην πρόβλεψη του τραπεζικού κινδύνου
title_sort data mining στην πρόβλεψη του τραπεζικού κινδύνου
publishDate 2020
url http://hdl.handle.net/10889/12928
work_keys_str_mv AT koukoseustratios dataminingstēnproblepsētoutrapezikoukindynou
AT koukoseustratios dataminingonpredictingbankrisk
_version_ 1799945014228287488
spelling nemertes-10889-129282022-09-06T07:03:52Z Data mining στην πρόβλεψη του τραπεζικού κινδύνου Data mining on predicting bank risk Κούκος, Ευστράτιος Παυλίδης, Γεώργιος Koukos, Eystratios Τσώλης, Δημήτριος Εξόρυξη δεδομένων Τραπεζικός κίνδυνος Ρευστότητα Data mining Bank risk Η ταξινόμηση δεδομένων έχει γίνει ένα σημαντικό ζήτημα, καθώς το ποσό των πληροφοριών που δημιουργούνται και πρέπει να αντιμετωπιστούν έχει αυξηθεί σημαντικά. Σήμερα οι επιστήμονες που κατασκευάζουν μοντέλα πρέπει να επιλέξουν μεταξύ της ευκολίας χρήσης παραδοσιακών τεχνικών ή της πολυπλοκότητας των νεότερων μεθόδων, οι οποίες τελικά μπορούν να παράγουν καλύτερα αποτελέσματα. Ειδικάσεοικονομικάδεδομέναόπωςταδάνειαοιερευνητέςεστιάζουνστονεντοπισμότου καλύτερουμοντέλουγιατηνπρόβλεψηςαθέτησηςπληρωμώνμέσααπόδιαθέσιμαστοιχεία χρηματοπιστωτικώνιδρυμάτων. Βασικά ερωτήματα που δημιουργούνται λοιπόν είναι ο όγκος δεδομένων που θα χρειαστούμε και ταυτόχρονα θα μπορούμε να διαχειριστούμε για την χρήση των μοντέλων μας , τα είδη μοντέλων που είναι διαθέσιμα για την πρόβλεψη οικονομικών μεγεθών όπως η αθέτηση ενός δανείου, τα χαρακτηριστικά που πρέπει να γνωρίζουμε όπου με βάση αυτά θα γίνεται ο χαρακτηρισμός. Ο πιστωτικός κίνδυνος αποτελεί τον σημαντικότερο κίνδυνο για τα χρηματοπιστωτικά ιδρύματα όσο και για οργανισμούς και εμφανίζεται με την απώλεια μιας χρηματικής αμοιβής ενός επενδυτή που οφείλεται στην αδυναμία εκπλήρωσης των υποχρεώσεων του αντισυμβαλλόμενου έναντι του οποίου υπάρχει απαίτηση . Είναι συνδεδεμένος στενά με τις υπηρεσίες εμπορικής τραπεζικής γι’ αυτό το λόγο συνδέεται με την πιστοληπτική ικανότητα των αντισυμβαλλόμενων του πιστωτικού ιδρύματος, γι’ αυτό το λόγο χαρακτηρίζεταιωςοσημαντικότεροςτόσοποσοτικάόσοκαιποιοτικάχρηματοοικονομικής φύσης κίνδυνος . Όσον αφορά τις επιχειρήσεις όταν έρχονται αντιμέτωπες με αυτό το είδος κινδύνου, έχει ως επακόλουθο να περιοριστεί η ρευστότητα τους λόγω ότι μειώνεται η πιστοληπτική τους ικανότητα, κάτι που συχνά οδηγεί σεπτώχευση. Έτσι αποτελεί πολύ σημαντικό στοιχείο η πρόβλεψη του πιστωτικού κινδύνου μέσα από σειράχαρακτηριστικώντουπελάτη.Ηδιαδικασίααυτήείναιιδιαίτεραπολύπλοκηαπότους υπαλλήλους ενός οργανισμού κι αυτό γιατί ο οργανισμός πρέπει να μπορεί και να προστατεύεται αλλά και να δανείζει αφού κερδίζει μέσω της διαδικασίας δανεισμού. Τα δε χαρακτηριστικά ενός πελάτη είναι αρκετά και ο συνδυασμός τους είναι αυτός που τελικά τον χαρακτηρίζει, γεγονός που κάνει έναν υπάλληλο να μην λειτουργεί με ασφάλεια και κυρίως τελικά να κοιτά τα μεγέθη στατικά και όχισυνδυαστικά. Σήμερα οι τραπεζικοί οργανισμοί μπορούν να επιλέξουν μεταξύ δύο προσεγγίσεων για τον καθορισμότωνκεφαλαιακώναπαιτήσεωντουπιστωτικούκινδύνου μιατυποποιημένη προσέγγισηπουβασίζεταισεαξιολογήσειςπουαποδίδονταιαπόεξωτερικούςοργανισμούς για περιουσιακά στοιχεία ή σε μια προσέγγιση εσωτερικής διαβάθμισης (IRB) στην οποία τα ιδρύματα μπορούν να εφαρμόζουν τα δικά τους εσωτερικά υποδείγματα για τον υπολογισμό των κεφαλαιακών απαιτήσεων του πιστωτικού κινδύνου. Οι τράπεζες που υιοθετούν την προσέγγισης IRB αναμένεται να παρέχουν εκτιμήσεις για τη ζημία που οφείλεται σε αδυναμίαπληρωμής. Αυτό επιβάλλει τη χρήση οικονομετρικών τεχνικών που λαμβάνουν υπόψη τον οριοθετημένο χαρακτήρα των ποσοστών ανάκτησης. Εμπειρικές μελέτες δείχνουν ότι δεν είναι εύκολο να βρεθούν επεξηγηματικές μεταβλητές που επηρεάζουν έντονα τα ποσοστά ανάκτησης. Ηπιοαπλήτεχνικήγιατηνανάκτησημοντέλωνείναιηγραμμικήπαλινδρόμησηδηλαδήτο κλασσικό μοντέλο που υπολογίζεται με τις συνήθεις μεθόδους ελαχίστων τετραγώνων. Η προσέγγιση χρησιμοποιείται στο Casellietal. (2008), Davydenko και Franks (2008) και Grunert και Weber (2009). Ωστόσο, η μοντελοποίηση και η πρόβλεψη ανακτήσεων με ένα γραμμικό μοντέλο έχει σοβαρούς περιορισμούς. Πρώτον, επειδή η υποστήριξη του γραμμικούμοντέλουδενεξασφαλίζειότιοιπροβλεπόμενεςτιμέςακολουθούνκαιγραμμική λογική και επίσης, δεδομένης της οριοθετημένης φύσης της εξαρτώμενης μεταβλητής, η μερική επίδραση οποιασδήποτε επεξηγηματικής μεταβλητής δεν μπορεί να είναισταθερή. Αυτοί οι περιορισμοί μπορούν να ξεπεραστούν χρησιμοποιώντας μια οικονομετρική μεθοδολογία ειδικά σχεδιασμένη για αναλογίες μοντελοποίησης, όπως η (μη γραμμική) κλασματική παλινδρόμηση που υπολογίζεται χρησιμοποιώντας μεθόδους ολικής πιθανότητας (Papke and Wooldridge,1996). Στο πλαίσιο των πιστωτικών απωλειών, η προσέγγιση αυτή υιοθετήθηκε από την Dermine και τη Neto de Carvalho (2006) και Chalupka και Kopecsni (2009). Μια εναλλακτική διαδικασία είναι η εφαρμογή της παλινδρόμησης σε κατάλληλα μετασχηματισμένες ανακτήσεις. Το πιο χαρακτηριστικό παράδειγμα αυτής της τεχνικής είναι το Moody'sLossCalcGupton and Stein το 2005, στο οποίο οι ανακτήσεις κανονικοποιούνται μέσω μιας βήτα κατανομής και πραγματοποιείται μια γραμμική παλινδρόμηση στο μετασχηματισμένο σύνολο δεδομένων. Μια ξεχωριστή προσέγγιση προσφέρεται από μη παραμετρικά μοντέλα, στα οποίο η λειτουργική μορφή για τον μέσον όρο της μεταβλητής απόκρισης δεν είναι προκαθορισμένη από τον ερευνητή αλλά προέρχεται από τις πληροφορίες που παρέχονται από τα δεδομένα. Έτσι ο Bastos (2010) πρότεινε τη χρήση μη παραμετρικών δέντρων παλινδρόμησης για μοντελοποίηση ανακτήσεις των τραπεζικών δανείων. Το πλεονέκτημα αυτής της τεχνικής είναι η ερμηνεία της, αφού ένα δεντρικό μοντέλο μοιάζει με ένα σύστημα αναζήτησης που περιέχειιστορικούςμέσουςόρουςανάκτησης.Επίπλέον,επειδήοιπροβλέψειςδίδονταιαπό τους μέσους όρους ανάκτησης, είναι αναπόφευκτα περιορισμένες στο διάστημαμονάδων. Επίσης εργασίες εφάρμοσαν τεχνητά νευρωνικά δικτύων για την πρόβλεψη ανακτήσεων τραπεζικών δανείων. Ένα τεχνητό νευρωνικό δίκτυο είναι μη παραμετρικό μαθηματικό μοντέλο που επιχειρεί να μιμηθεί τη λειτουργία των βιολογικών νευρωνικώνδικτύων.Αποτελείταιαπόμιαομάδαδιασυνδεδεμένωνμονάδωνεπεξεργασίας που χαρακτηρίζονται από νευρώνες. Λόγω στην καλή τους ικανότητα να προσεγγίζουν αυθαίρετες σύνθετες λειτουργίες, τα νευρωνικά δίκτυα έχουν εφαρμοστεί σε ένα ευρύ φάσμα επιστημονικώντομέων. Συγκεκριμένα,νευρωνικάδίκτυαέχουνχρησιμοποιηθείμεεπιτυχίαστημοντελοποίησητης πιθανότητας αθέτησης (βλέπε π.χ. Altmanetal., 1994), η οποία, μαζί με το ρυθμό ανάκαμψης, καθορίζει την αναμενόμενη πιστωτική ζημιά σε ένα χρηματοοικονομικό περιουσιακό στοιχείο. Σε αυτή τη μελέτη, τα νευρικά δίκτυα εκπαιδεύονται για να αναγνωρίσουν και να μάθουν από μια σειρά δεδομένων τα ποσοστά των τραπεζικών δανείων που βρίσκονται σε αδυναμίαπληρωμής. Η παρούσα διπλωματική εργασία εκπονήθηκε κατά τη διάρκεια του ακαδημαϊκού έτους 2018-2019 στο τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής, του ΠανεπιστημίουΠατρών,υπότηνεπίβλεψητουΚαθηγητή,κ.ΓεώργιοΠαυλίδη.Στόχοςτης διπλωματικής αυτής είναι η πρόβλεψη του πιστωτικού κινδύνου με χρήση των χαρακτηριστικών του δανειολήπτη. Για να γίνει αυτό σχεδιάζονται μοντέλα και εφαρμόζονταιόπωςνευρωνικάδίκτυα,δέντρααποφάσεως,μοντέλαπαλινδρόμησηςκ.α.Τα δεδομένα αντλήθηκαν από τον διαδικτυακό τόπο του επιστημονικού βιβλίου «CreditRiskAnalytics»,έναβιβλίοπουσυνιστάοδηγόπρακτικήςεφαρμογήςκαιμοντελοποίησηςειδικά για την διαχείριση και πρόβλεψη του ΠιστωτικούΚινδύνου. The way we can use algorithms to predict a bank risk and the most efficient of them.The banking system.Data Mining and banks.Opinion mining and sentimental analysis.Models with which we can evaluate credit risk.Bank risk categories. 2020-01-14T16:32:34Z 2020-01-14T16:32:34Z 2019-08-24 Thesis http://hdl.handle.net/10889/12928 gr 6 application/pdf