Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης

Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κολόης, Άλκης
Άλλοι συγγραφείς: Kolois, Alkis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14175
id nemertes-10889-14175
record_format dspace
spelling nemertes-10889-141752022-09-05T09:40:10Z Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης Graph models for the problem of TOP-N recommendations : implementation and performance analysis Κολόης, Άλκης Kolois, Alkis Μηχανική μάθηση Graph-based αλγόριθμοι Ανάκτηση πληροφορίας Συστήματα προτάσεων Top-N συστάσεις Machine learning Graph-based algorithms Information retrieval PageRank Recommendation systems TOP-N recommendation Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων. Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg. One of the most widely known technologies that is based in machine learning methods and knowledge mining from data, is the TOP-N systems of recommendation. Their implementations are presented in popular online systems such as Netflix and Amazon, whose commercial success was based primarily on a TOP-N proposal system. The idea behind them is called Collaborative Filtering and aims at the proper modeling of users and objects as sets of ratings. The modeling of the recommendation problem, by any method, results in a sparse user-item matrix, the analysis of which leads to object suggestions to users in order to increase the overall sales of the system. Admittedly, algorithms try to encourage the user to use services he has not yet tried. The problem of TOP-N recommendation is of great interest, as a result of which many algorithms have been proposed to solve it. One possible approach is to use graphs. Graph-Based algorithms manage to cope well with the problem of sparsity. Their main feature is that they allow the interaction of data features, even in cases where there is no direct connection between them, transmitting information through the edges of the graph. The most popular graph-based algorithm is PageRank, the mastermind behind Google’s success. During tis research three graph-based algorithms, including PageRank, were implemented and compared. Information was extracted through their performance evaluation with different metrics. The implementations are named accordingly: Personalized PageRank, Katz centrality, Parameter Supported PageRank. The metrics on which they were evaluated are : Precision-Recall, MRR, Ndcg. 2020-11-18T20:41:40Z 2020-11-18T20:41:40Z 2020-10-15 http://hdl.handle.net/10889/14175 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Μηχανική μάθηση
Graph-based αλγόριθμοι
Ανάκτηση πληροφορίας
Συστήματα προτάσεων
Top-N συστάσεις
Machine learning
Graph-based algorithms
Information retrieval
PageRank
Recommendation systems
TOP-N recommendation
spellingShingle Μηχανική μάθηση
Graph-based αλγόριθμοι
Ανάκτηση πληροφορίας
Συστήματα προτάσεων
Top-N συστάσεις
Machine learning
Graph-based algorithms
Information retrieval
PageRank
Recommendation systems
TOP-N recommendation
Κολόης, Άλκης
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
description Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων. Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg.
author2 Kolois, Alkis
author_facet Kolois, Alkis
Κολόης, Άλκης
author Κολόης, Άλκης
author_sort Κολόης, Άλκης
title Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
title_short Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
title_full Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
title_fullStr Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
title_full_unstemmed Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
title_sort μοντέλα γραφημάτων για το πρόβλημα των top-n συστάσεων : υλοποίηση και ανάλυση απόδοσης
publishDate 2020
url http://hdl.handle.net/10889/14175
work_keys_str_mv AT koloēsalkēs montelagraphēmatōngiatoproblēmatōntopnsystaseōnylopoiēsēkaianalysēapodosēs
AT koloēsalkēs graphmodelsfortheproblemoftopnrecommendationsimplementationandperformanceanalysis
_version_ 1771297182402478080