Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης
Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14175 |
id |
nemertes-10889-14175 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-141752022-09-05T09:40:10Z Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης Graph models for the problem of TOP-N recommendations : implementation and performance analysis Κολόης, Άλκης Kolois, Alkis Μηχανική μάθηση Graph-based αλγόριθμοι Ανάκτηση πληροφορίας Συστήματα προτάσεων Top-N συστάσεις Machine learning Graph-based algorithms Information retrieval PageRank Recommendation systems TOP-N recommendation Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων. Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg. One of the most widely known technologies that is based in machine learning methods and knowledge mining from data, is the TOP-N systems of recommendation. Their implementations are presented in popular online systems such as Netflix and Amazon, whose commercial success was based primarily on a TOP-N proposal system. The idea behind them is called Collaborative Filtering and aims at the proper modeling of users and objects as sets of ratings. The modeling of the recommendation problem, by any method, results in a sparse user-item matrix, the analysis of which leads to object suggestions to users in order to increase the overall sales of the system. Admittedly, algorithms try to encourage the user to use services he has not yet tried. The problem of TOP-N recommendation is of great interest, as a result of which many algorithms have been proposed to solve it. One possible approach is to use graphs. Graph-Based algorithms manage to cope well with the problem of sparsity. Their main feature is that they allow the interaction of data features, even in cases where there is no direct connection between them, transmitting information through the edges of the graph. The most popular graph-based algorithm is PageRank, the mastermind behind Google’s success. During tis research three graph-based algorithms, including PageRank, were implemented and compared. Information was extracted through their performance evaluation with different metrics. The implementations are named accordingly: Personalized PageRank, Katz centrality, Parameter Supported PageRank. The metrics on which they were evaluated are : Precision-Recall, MRR, Ndcg. 2020-11-18T20:41:40Z 2020-11-18T20:41:40Z 2020-10-15 http://hdl.handle.net/10889/14175 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Graph-based αλγόριθμοι Ανάκτηση πληροφορίας Συστήματα προτάσεων Top-N συστάσεις Machine learning Graph-based algorithms Information retrieval PageRank Recommendation systems TOP-N recommendation |
spellingShingle |
Μηχανική μάθηση Graph-based αλγόριθμοι Ανάκτηση πληροφορίας Συστήματα προτάσεων Top-N συστάσεις Machine learning Graph-based algorithms Information retrieval PageRank Recommendation systems TOP-N recommendation Κολόης, Άλκης Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
description |
Μία από τις ευρύτερα διαδεδομένες τεχνολογίες η οποία βασίζεται σε μεθόδους μηχανικής μάθησης και εξόρυξης γνώσης από δεδομένα, είναι τα TOP-N συστήματα προτάσεων. Υλοποιήσεις τους παρουσιάζονται σε δημοφιλή online συστήματα, όπως είναι το Netflix και η Amazon, της οποίας η εμπορική επιτυχία στηρίχτηκε κατεξοχήν σε ένα σύστημα TOP-N προτάσεων.
Η ιδέα πίσω από αυτά ονομάζεται Collaborative Filtering και στοχεύει στην κατάλληλη μοντελοποίηση χρηστών και αντικειμένων ως σύνολα ratings. Η μοντελοποίηση του προβλήματος συστάσεων, με οποιαδήποτε μέθοδο, καταλήγει σε ένα αραιό user-item μητρώο, του οποίου η ανάλυση οδηγεί σε προτάσεις αντικειμένων στους χρήστες, ώστε να αυξηθούν οι συνολικές πωλήσεις του συστήματος. Κατά γενική ομολογία, οι αλγόριθμοι προσπαθούν να παροτρύνουν τον χρήστη να χρησιμοποιήσει υπηρεσίες που ακόμα δεν έχει δοκιμάσει. Τ ο πρόβλημα των TOP-N συστάσεων φέρει μεγάλο ερευνητικό ενδιαφέρον με αποτέλεσμα να έχουν προταθεί πολλοί αλγόριθμοι επίλυσης του. Μια πιθανή προσέγγιση αποτελεί η χρήση γραφημάτων. Οι Graph-Based αλγόριθμοι καταφέρνουν να αντεπεξέλθουν καλά στο πρόβλημα του sparsity.Το βασικό χαρακτηριστικό τους είναι ότι επιτρέπουν την αλληλεπίδραση χαρακτηριστικών των δεδομένων, ακόμα και σε περιπτώσεις που δεν υπάρχει άμεση σύνδεση μεταξύ τους, μεταδίδοντας πληροφορία μέσω των ακμών του γραφήματος. Ο δημοφιλέστερος graph-based αλγόριθμος είναι ο PageRank, ο ιθύνων νους πίσω από την επιτυχία της Google. Κατά την διάρκεια της έρευνας που πραγματοποιήθηκε εξετάστηκαν τρεις graph-based αλγόριθμοι, συγκρίθηκαν και εξήχθησαν πληροφορίες για αυτούς μέσω μετρικών αξιολόγησης απόδοσης. Οι υλοποιήσεις ονομάζονται ως εξής: Personalized PageRank, Katz centrality και Parameter Supported PageRank. Οι μετρικές σύμφωνα με τις οποίες αξιολογήθηκαν είναι οι: Precision-Recall, MRR, Ndcg. |
author2 |
Kolois, Alkis |
author_facet |
Kolois, Alkis Κολόης, Άλκης |
author |
Κολόης, Άλκης |
author_sort |
Κολόης, Άλκης |
title |
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
title_short |
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
title_full |
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
title_fullStr |
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
title_full_unstemmed |
Μοντέλα γραφημάτων για το πρόβλημα των TOP-N συστάσεων : υλοποίηση και ανάλυση απόδοσης |
title_sort |
μοντέλα γραφημάτων για το πρόβλημα των top-n συστάσεων : υλοποίηση και ανάλυση απόδοσης |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/14175 |
work_keys_str_mv |
AT koloēsalkēs montelagraphēmatōngiatoproblēmatōntopnsystaseōnylopoiēsēkaianalysēapodosēs AT koloēsalkēs graphmodelsfortheproblemoftopnrecommendationsimplementationandperformanceanalysis |
_version_ |
1771297182402478080 |