Έρευνα και ανάπτυξη συστήματος αναγνώρισης και μείωσης της μεροληψίας σε μεθόδους μηχανικής μάθησης

Η μηχανική μάθηση όπως αναφέρεται και σε αυτή την διπλωματική εργασία είναι ένας τομέας που ολοένα και περισσότερο εισβάλλει στην καθημερινότητα των ανθρώπων. Μπορούμε πλέον να την βρούμε σε πολλές εφαρμογές έχοντας κυρίαρχο ρόλο στην λήψη των αποφάσεων σε διάφορα ζητήματα. Οι αποφάσεις αυτές επειδή...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αρβανιτάκης, Σπυρίδων
Άλλοι συγγραφείς: Arvanitakis, Spyridon
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15186
Περιγραφή
Περίληψη:Η μηχανική μάθηση όπως αναφέρεται και σε αυτή την διπλωματική εργασία είναι ένας τομέας που ολοένα και περισσότερο εισβάλλει στην καθημερινότητα των ανθρώπων. Μπορούμε πλέον να την βρούμε σε πολλές εφαρμογές έχοντας κυρίαρχο ρόλο στην λήψη των αποφάσεων σε διάφορα ζητήματα. Οι αποφάσεις αυτές επειδή βασίζονται σε αλγοριθμικά μοντέλα μάθησης μπορεί να είναι άδικες, αναπαράγοντας προκαταλήψεις στα δεδομένα που έχουμε. Επειδή ζούμε στην εποχή των μεγάλων δεδομένων αρκετές βιομηχανίες αναζητούν νέους τρόπους και αλγορίθμους για να επεξεργαστούν τα δεδομένα αυτά διότι από μόνα τους δημιουργούν προκατειλημμένες υποομάδες με αποτέλεσμα να έχουμε άδικα αποτελέσματα. Ακόμα οι τεχνικές μηχανικής μάθησης παρατηρούμε ότι υπάρχουν σε ολοένα και περισσότερους τομείς. Σε αυτή την διπλωματική εργασία κάνουμε μια αναφορά σε βασικές έννοιες όπως είναι η Τεχνητή νοημοσύνη, η Μηχανική μάθηση και το Deep learning. Στην συνέχεια αναφερόμαστε στον μετριασμό της προκατάληψης σε διάφορες κατηγορίες αλγορίθμων όπου αυτός είναι και ο σκοπός της συγγραφής του συγκεκριμένου εγγράφου. Αναφερόμαστε στους διάφορους αλγορίθμους που μπορούμε να χρησιμοποιήσουμε για να μπορέσουμε να μειώσουμε την προκατάληψη. Για τον σκοπό αυτό έχει δημιουργηθεί μια εφαρμογή η οποία χρησιμοποιεί μια σειρά από διάφορους αλγορίθμους με σκοπό να καταφέρουμε να εξάγουμε τις καλύτερες δυνατές αποφάσεις για τα δεδομένα μας. Τα δεδομένα που χρησιμοποιούμε προέρχονται από το αποθετήριο του UCI και πιο συγκεκριμένα αναφέρονται στο σύνολο δεδομένων Adult το οποίο αποτελείται από 14 μεταβλητές και τα χαρακτηριστικά του δεν χρησιμοποιούν την ομοιόμορφη κατανομή. Τέλος, η παρουσίαση των αποτελεσμάτων γίνεται με γραφικές παραστάσεις οι οποίες παρουσιάζουν πόσο κατάφερε ο κάθε αλγόριθμος να μετριάσει την προκατάληψη των δεδομένων μας και πόσο κοντά βρίσκεται η επεξεργασία που κάναμε στην σωστή λήψη των αποτελεσμάτων.