Περίληψη: | Η μη αρνητική (ακριβής ή προσεγγιστική) παραγοντοποίηση μητρώων (nonnegative matrix factorization, συντμ. NMF) είναι μία σημαντική μέθοδος για την επίτευξη διαστατικής μείωσης μη αρνητικών δεδομένων που αναπαρίστανται ως μητρώα καθώς και για την ανάδειξη σημαντικών χαρακτηριστικών, των δεδομένων.
Παρότι η NMF έχει το πλεονέκτημα της εμνηνευτικότητας (interpretability) καθώς οι παράγοντες επιλέγονται να είναι μη αρνητικοί, αντιστοιχεί σε ένα μαθηματικό πρόβλημα μη κυρτής βελτιστοποίησης και ως εκ τούτου είναι πολύ δυσκολότερο από τη βασική μέθοδο διαστατικής μείωσης, που επιτυγχάνεται μέσω της παραγοντοποίησης ιδιαζουσών τιμών (SVD).
Πέραν κάποιων ειδικών περιπτώσεων, οι αλγόριθμοι NMF είναι επαναληπτικοί, επομένως ένα απαραίτητο συστατικό τους είναι η αρχικοποίηση των μεταβλητών. Το πρόβλημα της αρχικοποίησης απασχολεί τους ερευνητές και η εύρεση αποτελεσματικών μεθόδων είναι ζητούμενο και στόχος πολλών εργασιών. Προς αυτήν την κατεύθυνση, στόχος της παρούσας διπλωματικής εργασίας είναι η μελέτη των σημαντικότερων τεχνικών αρχικοποίησης της πρόσφατης βιβλιογραφίας, η κατηγοριοποίηση των μεθόδων αυτών και η σχεδίαση, παρουσίαση και υλοποίηση μίας μεθόδου που ονομάζουμε CSS-NMF που ανταγωνίζεται και συχνά υπερτερεί σε ακρίβεια σε σχέση με τις σύγχρονες μεθόδους αιχμής.
|