Ανάπτυξη αποδοτικού αλγορίθμου συνεργατικής διήθησης με χρήση των διανυσμάτων Lanczos για το πρόβλημα των top-N συστάσεων σε συστήματα μεγάλου όγκου δεδομένων

Σκοπός της παρούσας διπλωματικής εργασίας είναι η μελέτη και ανάπτυξη ενός νέου αλγοριθμικού πλαισίου Συνεργατικής Διήθησης (Collaborative Filtering) για την παραγωγή συστάσεων, και ειδικότερα για το πρόβλημα των top-N συστάσεων. Προτείνουμε λοιπόν τον Lanczos Latent Factor Recommender (LLFR), έναν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Καλαντζή, Μαρία
Άλλοι συγγραφείς: Γαροφαλάκης, Γιάννης
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9578
Περιγραφή
Περίληψη:Σκοπός της παρούσας διπλωματικής εργασίας είναι η μελέτη και ανάπτυξη ενός νέου αλγοριθμικού πλαισίου Συνεργατικής Διήθησης (Collaborative Filtering) για την παραγωγή συστάσεων, και ειδικότερα για το πρόβλημα των top-N συστάσεων. Προτείνουμε λοιπόν τον Lanczos Latent Factor Recommender (LLFR), έναν νέο CF αλγόριθμο, φιλικό στη διαχείριση μεγάλου όγκου δεδομένων για το πρόβλημα των top-N συστάσεων. Χρησιμοποιώντας μία προσέγγιση υπολογιστικά αποδοτική η οποία βασίζεται στη μέθοδο Lanczos, ο LLFR μειώνει τη διάσταση του προβλήματος κατασκευάζοντας ένα latent factor μοντέλο, το οποίο μπορεί άμεσα να αξιοποιηθεί για την παραγωγή προσωποποιημένων διανυσμάτων κατάταξης στο χώρο αντικειμένων. Μια σειρά πειραμάτων σε πραγματικά σύνολα δεδομένων υποδεικνύουν ότι ο LLFR αποδίδει καλύτερα συγκριτικά με άλλες γνωστές μεθόδους top-N συστάσεων.Επιπλέον, τα πειραματικά μας αποτελέσματα δείχνουν ότι αυτό το προβάδισμα στην απόδοση, αυξάνεται καθώς τα δεδομένα γίνονται αραιότερα, όπως στο Cold Start Problem. Πιο συγκεκριμένα, ο LLFR αποδίδει καλύτερα τόσο στην περίπτωση όπου η αραιότητα είναι γενικευμένη – όπως στο New Community Problem, το οποίο συναντάται στα πραγματικά συστήματα κατά τα αρχικά τους στάδια όπου δεν υπάρχουν αρκετά δεδομένα ακόμα στο σύστημα – όσο και στην ιδιαίτερα ενδιαφέρουσα περίπτωση όπου η αραιότητα εντοπίζεται τοπικά σε ένα μικρό κομμάτι των δεδομένων – όπως στο New Users Problem, το οποίο συναντάται κατά την εισαγωγή νέων χρηστών σε ένα υπάρχον σύστημα, όπου ακριβώς επειδή αυτοί οι χρήστες είναι νέοι δεν έχουν προλάβει να βαθμολογήσουν αντικείμενα.