Ανάπτυξη αποδοτικού αλγορίθμου συνεργατικής διήθησης με χρήση των διανυσμάτων Lanczos για το πρόβλημα των top-N συστάσεων σε συστήματα μεγάλου όγκου δεδομένων

Σκοπός της παρούσας διπλωματικής εργασίας είναι η μελέτη και ανάπτυξη ενός νέου αλγοριθμικού πλαισίου Συνεργατικής Διήθησης (Collaborative Filtering) για την παραγωγή συστάσεων, και ειδικότερα για το πρόβλημα των top-N συστάσεων. Προτείνουμε λοιπόν τον Lanczos Latent Factor Recommender (LLFR), έναν...

Full description

Bibliographic Details
Main Author:	Καλαντζή, Μαρία
Other Authors:	Γαροφαλάκης, Γιάννης
Format:	Thesis
Language:	Greek
Published:	2016
Subjects:	Συστήματα συστάσεων Συνεργατική διήθηση Αραιότητα Recommender systems Collaborative filtering Top-N Sparsity Lanczos method Dimensionality reduction 006.312
Online Access:	http://hdl.handle.net/10889/9578

Description
Summary:	Σκοπός της παρούσας διπλωματικής εργασίας είναι η μελέτη και ανάπτυξη ενός νέου αλγοριθμικού πλαισίου Συνεργατικής Διήθησης (Collaborative Filtering) για την παραγωγή συστάσεων, και ειδικότερα για το πρόβλημα των top-N συστάσεων. Προτείνουμε λοιπόν τον Lanczos Latent Factor Recommender (LLFR), έναν νέο CF αλγόριθμο, φιλικό στη διαχείριση μεγάλου όγκου δεδομένων για το πρόβλημα των top-N συστάσεων. Χρησιμοποιώντας μία προσέγγιση υπολογιστικά αποδοτική η οποία βασίζεται στη μέθοδο Lanczos, ο LLFR μειώνει τη διάσταση του προβλήματος κατασκευάζοντας ένα latent factor μοντέλο, το οποίο μπορεί άμεσα να αξιοποιηθεί για την παραγωγή προσωποποιημένων διανυσμάτων κατάταξης στο χώρο αντικειμένων. Μια σειρά πειραμάτων σε πραγματικά σύνολα δεδομένων υποδεικνύουν ότι ο LLFR αποδίδει καλύτερα συγκριτικά με άλλες γνωστές μεθόδους top-N συστάσεων.Επιπλέον, τα πειραματικά μας αποτελέσματα δείχνουν ότι αυτό το προβάδισμα στην απόδοση, αυξάνεται καθώς τα δεδομένα γίνονται αραιότερα, όπως στο Cold Start Problem. Πιο συγκεκριμένα, ο LLFR αποδίδει καλύτερα τόσο στην περίπτωση όπου η αραιότητα είναι γενικευμένη – όπως στο New Community Problem, το οποίο συναντάται στα πραγματικά συστήματα κατά τα αρχικά τους στάδια όπου δεν υπάρχουν αρκετά δεδομένα ακόμα στο σύστημα – όσο και στην ιδιαίτερα ενδιαφέρουσα περίπτωση όπου η αραιότητα εντοπίζεται τοπικά σε ένα μικρό κομμάτι των δεδομένων – όπως στο New Users Problem, το οποίο συναντάται κατά την εισαγωγή νέων χρηστών σε ένα υπάρχον σύστημα, όπου ακριβώς επειδή αυτοί οι χρήστες είναι νέοι δεν έχουν προλάβει να βαθμολογήσουν αντικείμενα.

Ανάπτυξη αποδοτικού αλγορίθμου συνεργατικής διήθησης με χρήση των διανυσμάτων Lanczos για το πρόβλημα των top-N συστάσεων σε συστήματα μεγάλου όγκου δεδομένων

Similar Items