A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization

Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κολώνιας, Λεωνίδας
Άλλοι συγγραφείς: Kolonias, Leonidas
Γλώσσα:English
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/24033
id nemertes-10889-24033
record_format dspace
institution UPatras
collection Nemertes
language English
topic Nonneggative Least Squares (NNLS)
Nonnegative Matrix Factorization (NMF)
Multiple right-hand sides
Block Krylov subspaces
Numerical linear algebra
Μη αρνητικά ελάχιστα τετράγωνα
Μη αρνητική παραγοντοποίηση μητρώων
Πολλά δεξιά μέλη
Μπλοκ υπόχωροι Krylov
spellingShingle Nonneggative Least Squares (NNLS)
Nonnegative Matrix Factorization (NMF)
Multiple right-hand sides
Block Krylov subspaces
Numerical linear algebra
Μη αρνητικά ελάχιστα τετράγωνα
Μη αρνητική παραγοντοποίηση μητρώων
Πολλά δεξιά μέλη
Μπλοκ υπόχωροι Krylov
Κολώνιας, Λεωνίδας
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
description Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity constraints. NMF is a data analysis technique used in a great variety of applications such as text mining, image processing, hyperspectral data analysis, computational biology, and clustering. In more detail, the nonnegative factors can be interpreted as data e.g., as images described by pixel intensities or texts represented by vectors of word counts. The mathematical formulation for NMF appears as a non-convex optimization problem, and various types of algorithms have been devised to solve the problem. The first goal of this thesis is to propose a new efficient, yet simple to implement, approach to solve nonnegative linear least squares problems for multiple right-hand sides. More precisely, we study and use properties of global algorithms for least squares problems which are then combined with rules that enforce nonnegativity and lead to novel techniques for solving the aforementioned problem by a flexible Krylov subspace method. Comparisons of the state of the art algorithms using datasets and examples that come from real life applications as well as those artificially generated show that the proposed new algorithm presents a satisfactory behaviour and in some cases outperforms existing ones in computational speed and accuracy. Our second goal is to study extensively the NMF, its properties and applications and dive into the existing algorithms and methodologies used in order to approximate a solution for it. Moreover, using our new approach, tuned to solve large scale nonnegative least squares problems for multiple right-hand sides we present a novel algorithm for NMF based on the alternating nonnegative least squares (ANLS) framework. Extensive experiments on document clustering, images and synthetic datasets indicate the effectiveness of our approach.
author2 Kolonias, Leonidas
author_facet Kolonias, Leonidas
Κολώνιας, Λεωνίδας
author Κολώνιας, Λεωνίδας
author_sort Κολώνιας, Λεωνίδας
title A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
title_short A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
title_full A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
title_fullStr A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
title_full_unstemmed A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
title_sort nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
publishDate 2022
url https://hdl.handle.net/10889/24033
work_keys_str_mv AT kolōniasleōnidas anonnegativeleastsquaressolverformultiplerighthandsidesforapproximatingthenonnegativematrixfactorization
AT kolōniasleōnidas epilytesproblēmatōnmēarnētikōnelachistōntetragōnōnmepolladexiamelēgiatēnprosengisētēsmēarnētikēsparagontopoiēsēsmētrōōn
AT kolōniasleōnidas nonnegativeleastsquaressolverformultiplerighthandsidesforapproximatingthenonnegativematrixfactorization
_version_ 1771297129653862400
spelling nemertes-10889-240332022-11-29T10:02:38Z A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization Επιλυτές προβλημάτων μη αρνητικών ελαχίστων τετραγώνων με πολλά δεξιά μέλη για την προσέγγιση της μη αρνητικής παραγοντοποίησης μητρώων Κολώνιας, Λεωνίδας Kolonias, Leonidas Nonneggative Least Squares (NNLS) Nonnegative Matrix Factorization (NMF) Multiple right-hand sides Block Krylov subspaces Numerical linear algebra Μη αρνητικά ελάχιστα τετράγωνα Μη αρνητική παραγοντοποίηση μητρώων Πολλά δεξιά μέλη Μπλοκ υπόχωροι Krylov Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity constraints. NMF is a data analysis technique used in a great variety of applications such as text mining, image processing, hyperspectral data analysis, computational biology, and clustering. In more detail, the nonnegative factors can be interpreted as data e.g., as images described by pixel intensities or texts represented by vectors of word counts. The mathematical formulation for NMF appears as a non-convex optimization problem, and various types of algorithms have been devised to solve the problem. The first goal of this thesis is to propose a new efficient, yet simple to implement, approach to solve nonnegative linear least squares problems for multiple right-hand sides. More precisely, we study and use properties of global algorithms for least squares problems which are then combined with rules that enforce nonnegativity and lead to novel techniques for solving the aforementioned problem by a flexible Krylov subspace method. Comparisons of the state of the art algorithms using datasets and examples that come from real life applications as well as those artificially generated show that the proposed new algorithm presents a satisfactory behaviour and in some cases outperforms existing ones in computational speed and accuracy. Our second goal is to study extensively the NMF, its properties and applications and dive into the existing algorithms and methodologies used in order to approximate a solution for it. Moreover, using our new approach, tuned to solve large scale nonnegative least squares problems for multiple right-hand sides we present a novel algorithm for NMF based on the alternating nonnegative least squares (ANLS) framework. Extensive experiments on document clustering, images and synthetic datasets indicate the effectiveness of our approach. Προβλήματα μη αρνητικών ελαχίστων τετραγώνων, όπου οι τιμές της λύσης περιορίζονται να είναι μόνο μη αρνητικές εμφανίζονται σε πολλες εφαρμογές, καθώς επίσης αποτελούν το κύριο πρόβλημα των περισσότερων επιλυτών για τη μη αρνητική παραγοντοποίηση μητρώων (NMF), μια παραγοντοποίση κατά την οποία ένα μητρώο διασπάται σε γινόμενο δύο άλλων πολύ μικρότερου βαθμού με μη αρνητικές τιμές. Η μη αρνητική παραγοντοποίηση είναι αποτελεί μια τεχνική ανάλυσης δεδομένων η οποία χρησιμοποιείται σε πληθώρα εφαρμογών όπως η εξόρυξη κειμένου, η επεξεργασία εικόνας, η υπερφασματική ανάλυση δεδομένων, η υπολογιστική βιολογία και η ομαδοποίηση. Αναλυτικότερα, οι μη αρνητικοί παράγοντες μπορούν να ερμηνευθούν ως δεδομένα, π.χ. ως εικόνες που περιγράφονται με εντάσεις εικονοστοιχείων ή κείμενα που αντιπροσωπεύονται από διανύσματα πλήθους λέξεων. Η μαθηματική διατύπωση για τη μη αρνητική παραγοντοποίηση εμφανίζεται ως ένα μη κυρτό πρόβλημα βελτιστοποίησης και μέχρι σήμερα έχουν προταθεί διάφοροι τύποι αλγορίθμων για την επίλυση της. Ο πρώτος στόχος αυτής της διπλωματικής εργασσίας είναι να παρουσιάσει μια νέα αποτελεσματική, αλλά απλή στην εφαρμογή, προσέγγιση για την επίλυση προβλημάτων μη αρνητικών ελαχίστων τετραγώνων για πολλά δεξιά μέλη. Πιο συγκεκριμένα, μελετώνται και χρησιμοποιούνται ιδιότητες καθολικών (global) αλγορίθμων για προβλήματα ελαχίστων τετραγώνων, οι οποίες στη συνέχεια συνδυάζονται με κανόνες που επιβάλλουν τη μη αρνητικότητα και οδηγούν σε μια νέα τεχνική για την επίλυση του προαναφερθέντος προβλήματος βασιζόμενη στους ευέλικτους υποχώρους Krylov. Συγκρίσεις με αλγορίθμους τελευταίας τεχνολογίας χρησιμοποιώντας σύνολα δεδομένων και παραδείγματα που προέρχονται τόσο από πραγματικές εφαρμογές καθώς και τεχνητά δεδομένα δείχνουν ότι ο προτεινόμενος νέος αλγόριθμος παρουσιάζει ικανοποιητική συμπεριφορά και σε ορισμένες περιπτώσεις υπερέχει των υπαρχόντων σε υπολογιστική ταχύτητα και ακρίβεια. Ο δεύτερος στόχος μας είναι να μελετήσουμε εκτενώς τη μη αρνητική παραγοντοποίηση, τόσο τις ιδιότητες και τις εφαρμογές της αλλά κυρίως τους υπάρχοντες αλγόριθμους και μεθοδολογίες που προτείνονται για την εξέυρεση λύσης. Επιπλέον, χρησιμοποιώντας τη νέα μας μέθοδο, προσαρμοσμένη για την επίλυση προβλημάτων μη αρνητικών ελαχίστων τετραγώνων μεγάλης κλίμακας για πολλά δεξιά μέλη, παρουσιάζουμε έναν νέο αλγόριθμο για το NMF που βασίζεται στο πλαίσιο εναλλασσόμενων μη αρνητικών ελαχίστων τετραγώνων (ANLS). Τέλος παρουσιάζονται εκτεταμένα πειράματα σχετικά με ομαδοποίηση εγγράφων και εικόνες αλλά και πειράματα σε συνθετικά σύνολα δεδομένων τα οποία υποδηλώνουν την αποτελεσματικότητα της προσέγγισής μας. 2022-11-16T11:28:23Z 2022-11-16T11:28:23Z 2022-11-04 https://hdl.handle.net/10889/24033 en Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf