Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση

Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που πα...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Τερεζάκης, Γεώργιος
Άλλοι συγγραφείς: Terezakis, George
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15930
id nemertes-10889-15930
record_format dspace
spelling nemertes-10889-159302022-09-05T09:40:15Z Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση Research and development of a system for bias identification in machine learning Τερεζάκης, Γεώργιος Terezakis, George Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση. Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη. Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά. As we live in an era where the world’s most valuable resource is no longer oil but data, technology companies focus on how they can gather it and extract precious conclusions to evolve their current technologies. The amount of data we produce every day is 2.5 quintillion bytes at our current pace. The after-effect is that processing and extracting meaningful information is humanly impossible. So, companies are using automated techniques for extracting knowledge from Big Data sets such as Machine Learning. However, the training of the machine is a process that humans perform, so intuitively the fairness of a decision that a machine learning system makes is controversial. As a result, data mistreatments by engineers can result in extracted knowledge that is biased. The dissertation aimed to develop a benchmark tool accessible to all researchers and programmers interested in discovering using the Disparate Impact metric, which machine learning model would be fairer in their dataset. The user can enter his data set through the web application tool by selecting the fields he wants to study, returning in real-time the results reproduced by the various machine learning models applied to the data fed to the system as well as the results of Disparate Impact for each model separately. 2022-03-08T08:13:51Z 2022-03-08T08:13:51Z 2022-02-08 http://hdl.handle.net/10889/15930 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μεροληψία
Μεροληψία στη μηχανική μάθηση
Μηχανική μάθηση
Δικαιοσύνη στη μηχανική μάθηση
Bias
Bias in machine learning
Machine learning justice
Compas
spellingShingle Μεροληψία
Μεροληψία στη μηχανική μάθηση
Μηχανική μάθηση
Δικαιοσύνη στη μηχανική μάθηση
Bias
Bias in machine learning
Machine learning justice
Compas
Τερεζάκης, Γεώργιος
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
description Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση. Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη. Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά.
author2 Terezakis, George
author_facet Terezakis, George
Τερεζάκης, Γεώργιος
author Τερεζάκης, Γεώργιος
author_sort Τερεζάκης, Γεώργιος
title Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_short Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_full Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_fullStr Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_full_unstemmed Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_sort έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
publishDate 2022
url http://hdl.handle.net/10889/15930
work_keys_str_mv AT terezakēsgeōrgios ereunakaianaptyxēsystēmatosanagnōrisēsmerolēpsiasstēmēchanikēmathēsē
AT terezakēsgeōrgios researchanddevelopmentofasystemforbiasidentificationinmachinelearning
_version_ 1771297199180742656