Περίληψη: | Στο πέμπτο κεφάλαιο θα μελετήσουμε τους βασικούς αλγορίθμους ανάλυσης και παραγοντοποίησης πινάκων (matrix factorization). Θα ορίσουμε το πρόβλημα της σύστασης στοιχείων σε χρήστες ως έναν διδιάστατο πίνακα που θα κρατά τις βαθμολογίες που δίνουν οι δεύτεροι στα πρώτα. Επίσης, θα ορίσουμε μια αντικειμενική συνάρτηση για την ελαχιστοποίηση της διαφοράς μεταξύ της πραγματικής και της προβλεπόμενης βαθμολογίας ενός χρήστη για ένα στοιχείο. Στη συνέχεια, θα περιγράψουμε την Αποσύνθεση Πίνακα βάσει Ιδιαζουσών Τιμών (Singular Value Decomposition) και την Ανάλυση Πίνακα βάσει Εναλλασσόμενων Ελαχίστων Τετραγώνων (Alternating Least Squares). Θα ακολουθήσει ο ορισμός πινάκων υψηλότερης τάξης (τενσόρων), όπου συμμετέχουν περισσότερες οντότητες (χρήστες, στοιχεία, κατηγορίες στοιχείων κ.λπ.), καθώς και η περιγραφή αλγορίθμων ανάλυσης και παραγοντοποίησης τενσόρων. Τέλος, θα γίνει ορισμός του προβλήματος ως pairwise ranking (κατάταξη στοιχείων ανά ζεύγος), που σημαίνει ότι θα επιχειρήσουμε να προβλέψουμε τη σωστή κατάταξη των στοιχείων στη λίστα συστάσεων που αφορά έναν χρήστη. Πιο συγκεκριμένα, θα ορίσουμε μία νέα αντικειμενική συνάρτηση, στόχος της οποίας θα είναι να προτείνουμε πάντα σε καλύτερη κατάταξη ένα στοιχείο με το οποίο έχει αλληλεπιδράσει ο χρήστης στο παρελθόν συγκριτικά με κάποιο άλλο στοιχείο με το οποίο δεν υπήρξε διάδραση.
|