Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που πα...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/15930 |
id |
nemertes-10889-15930 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-159302022-09-05T09:40:15Z Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση Research and development of a system for bias identification in machine learning Τερεζάκης, Γεώργιος Terezakis, George Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση. Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη. Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά. As we live in an era where the world’s most valuable resource is no longer oil but data, technology companies focus on how they can gather it and extract precious conclusions to evolve their current technologies. The amount of data we produce every day is 2.5 quintillion bytes at our current pace. The after-effect is that processing and extracting meaningful information is humanly impossible. So, companies are using automated techniques for extracting knowledge from Big Data sets such as Machine Learning. However, the training of the machine is a process that humans perform, so intuitively the fairness of a decision that a machine learning system makes is controversial. As a result, data mistreatments by engineers can result in extracted knowledge that is biased. The dissertation aimed to develop a benchmark tool accessible to all researchers and programmers interested in discovering using the Disparate Impact metric, which machine learning model would be fairer in their dataset. The user can enter his data set through the web application tool by selecting the fields he wants to study, returning in real-time the results reproduced by the various machine learning models applied to the data fed to the system as well as the results of Disparate Impact for each model separately. 2022-03-08T08:13:51Z 2022-03-08T08:13:51Z 2022-02-08 http://hdl.handle.net/10889/15930 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas |
spellingShingle |
Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas Τερεζάκης, Γεώργιος Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
description |
Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το
πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο
πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να
εξελίξουν τις τρέχουσες τεχνολογίες τους.
Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια
bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η
εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες
χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες
Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση.
Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από
ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής
μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από
μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη.
Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα
έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να
ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής
μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να
εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία
τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό
χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής
μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά. |
author2 |
Terezakis, George |
author_facet |
Terezakis, George Τερεζάκης, Γεώργιος |
author |
Τερεζάκης, Γεώργιος |
author_sort |
Τερεζάκης, Γεώργιος |
title |
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
title_short |
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
title_full |
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
title_fullStr |
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
title_full_unstemmed |
Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
title_sort |
έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/15930 |
work_keys_str_mv |
AT terezakēsgeōrgios ereunakaianaptyxēsystēmatosanagnōrisēsmerolēpsiasstēmēchanikēmathēsē AT terezakēsgeōrgios researchanddevelopmentofasystemforbiasidentificationinmachinelearning |
_version_ |
1771297199180742656 |