Ανάπτυξη πρωτότυπων μερικώς επιβλεπόμενων αλγορίθμων μηχανικής μάθησης

Οι ολοένα και περισσότερες τεχνολογικές εφαρμογές που αλληλοεπιδρούν με τις διάφορες πτυχές της ανθρώπινης υπόστασης, έχουν φτάσει σήμερα να χαρακτηρίζονται από ένα κοινό στοιχείο: την παραγωγή τεράστιων ποσοτήτων δεδομένων, ιδίως αν αυτό συγκριθεί με τις προηγούμενες δεκαετίες. Αυτό το γεγονός, που...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κάρλος, Σταμάτης
Άλλοι συγγραφείς: Κωτσιαντής, Σωτήριος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13370
Περιγραφή
Περίληψη:Οι ολοένα και περισσότερες τεχνολογικές εφαρμογές που αλληλοεπιδρούν με τις διάφορες πτυχές της ανθρώπινης υπόστασης, έχουν φτάσει σήμερα να χαρακτηρίζονται από ένα κοινό στοιχείο: την παραγωγή τεράστιων ποσοτήτων δεδομένων, ιδίως αν αυτό συγκριθεί με τις προηγούμενες δεκαετίες. Αυτό το γεγονός, που έχει εναρμονιστεί ιδανικά με την ταυτόχρονη ανάπτυξη των τεχνολογιών αποθήκευσης και ανάκτησης αντίστοιχων ποσοτήτων δεδομένων, επιβάλει μεγάλες δυσκολίες κατά την αξιοποίηση τους ως πηγή πληροφόρησης για την εφαρμογή προβλεπτικών μοντέλων μάθησης σύμφωνα με τις αρχές των πεδίων της Μηχανικής Μάθησης και της Εξόρυξης Γνώσης. Ο κύριος λόγος είναι η αδυναμία κτήσης των ετικετών ή των πραγματικών τιμών που συνοδεύουν αυτές τις εγγραφές, ανάλογα με το αν αναφερόμαστε σε πρόβλημα Κατηγοριοποίησης ή Παλινδρόμησης, χωρίς να καταφεύγουμε σε διαδικασίες που επιβάλουν μεγάλες χρονικές καθυστερήσεις ή/και αντίστοιχα μεγάλα υλικά κόστη, αναλογιζόμενοι πάντοτε τον τεράστιο όγκο δεδομένων που καλούμαστε να διαχειριστούμε. Ως απάντηση σε αυτό το πρόβλημα διαχείρισης των πολυάριθμων συνήθως μη-ετικετοποιημένων στιγμιότυπων σε συνδυασμό με την παράλληλη ύπαρξη ενός μικρού πλήθους ετικετοποιημένων στιγμιότυπων, έχει αναδυθεί τα τελευταία χρόνια η εκδοχή των αλγορίθμων Μερικώς Επιβλεπόμενης Μάθησης. Σύμφωνα με αυτή την κατηγορία αλγορίθμων, το εκάστοτε προβλεπτικό μοντέλο εκπαιδεύεται βασιζόμενο σε ένα αρχικά μικρό πλήθος παραδειγμάτων και γίνεται προσπάθεια άντλησης των πιο χρήσιμων ανά περίπτωση στιγμιότυπων από την αρκετά μεγαλύτερη δεξαμενή μη-ετικετοποιημένων παραδειγμάτων, στοχεύοντας στη βελτίωση τόσο της συνολικής προβλεπτικής συμπεριφοράς όσο και της σθεναρότητας των αποφάσεων του, αποφορτίζοντας τον ανθρώπινο παράγοντα από τις χρονοβόρες διαδικασίες ετικετοποιήσης. Ουσιαστικά, επιδιώκεται η καλύτερη ιχνηλάτιση της υποβόσκουσας κατανομής παραγωγής των εκάστοτε εξεταζόμενων δεδομένων, έτσι ώστε να επιτευχθούν καλύτερα αποτελέσματα σε νέα άγνωστα δεδομένα. Δύο από τις σημαντικότερες κατηγορίες των αλγορίθμων Μερικώς Επιβλεπόμενης Μάθησης είναι αυτές της Ημιεπιβλεπόμενης και της Ενεργητικής Μάθησης. Αν και οι δύο αυτές ευρύτατες οικογένειες προσεγγίσεων παρουσιάζουν αρκετά κοινά στοιχεία, υιοθετώντας επαναληπτικά σχήματα μάθησης και επιτρέποντας σε πιθανοτικούς εκμαθητές να συνδυάζονται καταλλήλως υπό τον τρόπο λειτουργίας τους, διαφοροποιούνται ουσιαστικά σε ένα σημείο. Η πρώτη παράγει πλήρως αυτόνομα εργαλεία μάθησης, σε αντίθεση με τη δεύτερη, η οποία αξιοποιεί τον ανθρώπινο παράγοντα εντός του πυρήνα μάθησης της για την έγκυρη ενημέρωση επί των πιο αμφιλεγόμενων μη-ετικετοποιημένων παραδειγμάτων. Επί του πρακτέου, η κύρια συνεισφορά της παρούσας διατριβής έγκειται στην ανάδειξη της χρησιμότητας των ομαδοποιημένων εκμαθητών εντός του πλαισίου των αλγορίθμων Μερικώς Επιβλεπόμενης Μάθησης, την υιοθέτηση μηχανισμών που επιτρέπουν την περαιτέρω μείωση του κόστους, χρονικού ή υλικού, και την παρατήρηση της χρησιμότητας τους, καθώς και τη μελέτη της εφαρμογής παρόμοιων προσεγγίσεων σε επιστημονικά πεδία τα οποία δεν έχουν μελετηθεί, είτε καθόλου είτε χωρίς μεγάλη εμβάθυνση από άλλες σχετικές εργασίες στη βιβλιογραφία. Προκειμένου μάλιστα να διευρυνθεί η δυνατότητα εφαρμογής των προτεινόμενων αλγορίθμων, οι υποθέσεις που τέθηκαν ήταν αρκετά ανεκτικές, λειτουργώντας υπό αποδοτικά σχήματα μάθησης Μίας Όψης, δίνοντας ταυτόχρονα μεγάλο βάρος στην απόκτηση προβλέψεων υψηλής ποιότητας μέσω ποικίλων προσεγγίσεων σύστασης ομαδοποιημένων εκμαθητών. Η πρόταση μάλιστα συνεργασίας των δύο αυτών προσεγγίσεων υπό κοινό μηχανισμό αξιοποίησης των διαθέσιμων δεδομένων και υπολογιστικών πόρων, χαράσσει μία στρατηγική με πολύπλευρα πρακτικά οφέλη, τα οποία προκύπτουν από την αρμονικό συνδυασμό στρατηγικών μάθησης που περιορίζουν δραστικά τον χώρο μάθησης των υποψήφιων μοντέλων μάθησης. Ολοκληρώνοντας, θεωρούμε ότι η παρούσα διατριβή αποτελεί μία ολοκληρωμένη προσπάθεια μελέτης των εξεταζόμενων στρατηγικών μάθησης στο πεδίο της Μερικώς Επιβλεπόμενης Μάθησης, τόσο σε επίπεδο γενικών προβλημάτων όσο και σε πιο εξειδικευμένες περιπτώσεις, όπως αυτές καταγράφθηκαν και ερευνητικά. Απώτερος στόχος, πέρα από την ανάδειξη νέων αλγορίθμων, αποτελεί ο σχολιασμός και η εξαγωγή χρήσιμων συμπερασμάτων που μπορούν να ωφελήσουν τους ερευνητές που ασχολούνται με το πεδίο αυτό. Σύνδεσμος δημοσιεύσεων: https://dblp.org/pers/hd/k/Karlos:Stamatis