Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης

Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κολόης, Άλκης
Άλλοι συγγραφείς: Kolois, Alkis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14175
Περιγραφή
Περίληψη:Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων. Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg.