Περίληψη: | Η επιβλεπόμενη μηχανική μάθηση (supervised machine learning) είναι ένας τομέας της τεχνητής νοημοσύνης όπου το πρόγραμμα προσεγγίζει μία συνάρτηση βάσει των δεδομένων που δέχεται. Στην συνήθη επιβλεπόμενη μηχανική μάθηση χρησιμοποιεί κανείς ένα σύνολο δεδομένων (training data set) έτσι ώστε να βοηθήσει το πρόγραμμα να κατηγοριοποιήσει τα δεδομένα που του εισάγει ο χρήστης.
Πολλές φορές όμως είναι δύσκολο ή με μεγάλο κόστος (υπολογιστικό, χρονικό ή άλλο) να κατασκευαστεί το αρχικό σύνολο δεδομένων με τα κατηγοριοποιημένα δεδομένα. Για αυτόν τον λόγο, μελετήσαμε και παρουσιάζουμε μια νεότερη μέθοδο, ονόματι Ενεργητική Μηχανική Μάθηση. Με αυτήν το πρόγραμμα επιλέγει (με «ερωτήματα», queries) βάσει συγκεκριμένων στρατηγικών κάποια μη ταξινομημένα δεδομένα για κατηγοριοποίηση.
Ο στόχος της μεθόδου είναι να μεγιστοποιηθεί η ακρίβεια του προγραμματος μηχανικής μάθησης μέσω των «ερωτημάτων» που θέτει στα μη κατηγοριοποιημένα δεδομένα που υπάρχουν, ενώ παράλληλα μειώνεται το έργο που θα απαιτηθεί από τους «ειδικούς» (domain experts) του συγκεκριμένου αντικειμένου για την κατηγοριοποίηση των υπολοίπων δεδομένων.
Πέρα από την παρουσίαση της μεθόδου, και της βιβλιοθήκης JCLAL, έχουμε επιλέξει τρία ερωτήματα στα οποία θα προσπαθήσουμε να απαντήσουμε με εμπειρικές μεθόδους. Το πρώτο ερώτημα μας καλεί να συγκρίνουμε την μέθοδο της ενεργής μάθησης με αυτήν της παθητικής μάθησης. Είναι δηλαδή, καλύτερη η Ενεργητική Μάθηση από την Παθητική Μάθηση; Το δεύτερο ερώτημα εξετάζει τις στρατηγικές που δομούν το πλαίσιο της Ενεργητικής Μάθησης και τις συγκρίνει με την Τυχαία Στρατηγική (Random Sampling strategy). Τέλος, το τρίτο ερώτημα μας καλεί να βρούμε ποιος συνδυασμός στρατηγικής και αλγόριθμου μάθησης (learning algorithm) δίνει τα καλύτερα αποτελέσματα στα σύνολα δεδομένων που μελετάμε.
Από την στατιστική ανάλυση των πειραματικών αποτελεσμάτων παρατηρούμε πως από τους πέντε αλγόριθμους μάθησης, στους τρεις επικρατεί η στρατηγική της δειγματοληψίας εντροπίας ενώ στους δύο η λιγότερο βέβαιη δειγματοληψία. Αξίζει να σημειωθεί πως και στις πέντε περιπτώσεις δείξαμε πως τουλάχιστον μία στρατηγική μάθησης επικρατεί της τυχαίας δειγματοληψίας. Ακόμη δείξαμε με εμπειρικό τρόπο πως όλες οι στρατηγικές ενεργητικής μάθησης επικρατούν της παθητικής μάθησης.
|