Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση

Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που πα...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Τερεζάκης, Γεώργιος
Άλλοι συγγραφείς:	Terezakis, George
Γλώσσα:	Greek
Έκδοση:	2022
Θέματα:	Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas
Διαθέσιμο Online:	http://hdl.handle.net/10889/15930

id	nemertes-10889-15930
record_format	dspace
spelling	nemertes-10889-159302022-09-05T09:40:15Z Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση Research and development of a system for bias identification in machine learning Τερεζάκης, Γεώργιος Terezakis, George Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση. Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη. Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά. As we live in an era where the world’s most valuable resource is no longer oil but data, technology companies focus on how they can gather it and extract precious conclusions to evolve their current technologies. The amount of data we produce every day is 2.5 quintillion bytes at our current pace. The after-effect is that processing and extracting meaningful information is humanly impossible. So, companies are using automated techniques for extracting knowledge from Big Data sets such as Machine Learning. However, the training of the machine is a process that humans perform, so intuitively the fairness of a decision that a machine learning system makes is controversial. As a result, data mistreatments by engineers can result in extracted knowledge that is biased. The dissertation aimed to develop a benchmark tool accessible to all researchers and programmers interested in discovering using the Disparate Impact metric, which machine learning model would be fairer in their dataset. The user can enter his data set through the web application tool by selecting the fields he wants to study, returning in real-time the results reproduced by the various machine learning models applied to the data fed to the system as well as the results of Disparate Impact for each model separately. 2022-03-08T08:13:51Z 2022-03-08T08:13:51Z 2022-02-08 http://hdl.handle.net/10889/15930 gr application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas
spellingShingle	Μεροληψία Μεροληψία στη μηχανική μάθηση Μηχανική μάθηση Δικαιοσύνη στη μηχανική μάθηση Bias Bias in machine learning Machine learning justice Compas Τερεζάκης, Γεώργιος Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
description	Καθώς ζούμε στην εποχή που ο πιο πολύτιμος πόρος του κόσμου δεν είναι πλέον το πετρέλαιο, αλλά η πληροφορία, οι εταιρίες τεχνολογίας επικεντρώνονται στο πώς μπορούν να την συλλέξουν και να εξάγουν πολύτιμα συμπεράσματα για να εξελίξουν τις τρέχουσες τεχνολογίες τους. Ο όγκος των δεδομένων που παράγουμε κάθε μέρα είναι 2,5 πεντάκις εκατομμύρια bytes με τον τρέχοντα ρυθμό μας. Το αποτέλεσμα είναι ότι η επεξεργασία και η εξαγωγή σημαντικών πληροφοριών είναι ανθρώπινα αδύνατη. Έτσι, οι εταιρείες χρησιμοποιούν αυτοματοποιημένες τεχνικές για την εξαγωγή γνώσεων από μεγάλες Βάσεις Δεδομένων όπως τη Μηχανική Μάθηση. Η εκπαίδευση της μηχανής όμως είναι μια διαδικασία που πραγματοποιείται από ανθρώπους, έτσι η αμεροληψία μιας απόφασης που λαμβάνει ένα σύστημα μηχανικής μάθησης είναι αμφιλεγόμενη. Ως αποτέλεσμα, η κακομεταχείριση δεδομένων από μηχανικούς μπορούν να οδηγήσουν σε εξαγόμενη γνώση που είναι προκατειλημμένη. Ο στόχος της διπλωματικής ήταν η ανάπτυξη ενός εργαλείου αναφοράς στο οποίο θα έχουν πρόσβαση όλοι οι ερευνητές και προγραμματιστές που ενδιαφέρονται να ανακαλύψουν με την χρήση της μετρικής του Disparate Impact ποιο μοντέλο μηχανικής μάθησης θα ήταν πιο ‘δίκαιο’ στο δικό τους σύνολο δεδομένων. Ο χρήστης μπορεί να εισάγει το δικό του σύνολο δεδομένων μέσω του web application επιλέγοντας τα πεδία τα οποία θέλει να μελετήσει και να γίνει η ανάλυση, επιστρέφοντας σε πραγματικό χρόνο τα αποτελέσματα που αναπαράγονται από τα διάφορα μοντέλα μηχανικής μάθησης που εφαρμόζονται πάνω στα δεδομένα που τροφοδότησε στο σύστημα καθώς και τα αποτελέσματα του Disparate Impact για κάθε μοντέλο ξεχωριστά.
author2	Terezakis, George
author_facet	Terezakis, George Τερεζάκης, Γεώργιος
author	Τερεζάκης, Γεώργιος
author_sort	Τερεζάκης, Γεώργιος
title	Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_short	Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_full	Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_fullStr	Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_full_unstemmed	Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
title_sort	έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση
publishDate	2022
url	http://hdl.handle.net/10889/15930
work_keys_str_mv	AT terezakēsgeōrgios ereunakaianaptyxēsystēmatosanagnōrisēsmerolēpsiasstēmēchanikēmathēsē AT terezakēsgeōrgios researchanddevelopmentofasystemforbiasidentificationinmachinelearning
_version_	1771297199180742656

Έρευνα και ανάπτυξη συστήματος αναγνώρισης μεροληψίας στη μηχανική μάθηση

Παρόμοια τεκμήρια