A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization
Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | English |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/24033 |
id |
nemertes-10889-24033 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
English |
topic |
Nonneggative Least Squares (NNLS) Nonnegative Matrix Factorization (NMF) Multiple right-hand sides Block Krylov subspaces Numerical linear algebra Μη αρνητικά ελάχιστα τετράγωνα Μη αρνητική παραγοντοποίηση μητρώων Πολλά δεξιά μέλη Μπλοκ υπόχωροι Krylov |
spellingShingle |
Nonneggative Least Squares (NNLS) Nonnegative Matrix Factorization (NMF) Multiple right-hand sides Block Krylov subspaces Numerical linear algebra Μη αρνητικά ελάχιστα τετράγωνα Μη αρνητική παραγοντοποίηση μητρώων Πολλά δεξιά μέλη Μπλοκ υπόχωροι Krylov Κολώνιας, Λεωνίδας A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
description |
Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity constraints. NMF is a data analysis technique used in a great variety of applications such as text mining, image processing, hyperspectral data analysis, computational biology, and clustering. In more detail, the nonnegative factors can be interpreted as data e.g., as images described by pixel intensities or texts represented by vectors of word counts. The mathematical formulation for NMF appears as a non-convex optimization problem, and various types of algorithms have been devised to solve the problem.
The first goal of this thesis is to propose a new efficient, yet simple to implement, approach to solve nonnegative linear least squares problems for multiple right-hand sides. More precisely, we study and use properties of global algorithms for least squares problems which are then combined with rules that enforce nonnegativity and lead to novel techniques for solving the aforementioned problem by a flexible Krylov subspace method. Comparisons of the state of the art algorithms using datasets and examples that come from real life applications as well as those artificially generated show that the proposed new algorithm presents a satisfactory behaviour and in some cases outperforms existing ones in computational speed and accuracy.
Our second goal is to study extensively the NMF, its properties and applications and dive into the existing algorithms and methodologies used in order to approximate a solution for it. Moreover, using our new approach, tuned to solve large scale nonnegative least squares problems for multiple right-hand sides we present a novel algorithm for NMF based on the alternating nonnegative least squares (ANLS) framework. Extensive experiments on document clustering, images and synthetic datasets indicate the effectiveness of our approach. |
author2 |
Kolonias, Leonidas |
author_facet |
Kolonias, Leonidas Κολώνιας, Λεωνίδας |
author |
Κολώνιας, Λεωνίδας |
author_sort |
Κολώνιας, Λεωνίδας |
title |
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
title_short |
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
title_full |
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
title_fullStr |
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
title_full_unstemmed |
A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
title_sort |
nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization |
publishDate |
2022 |
url |
https://hdl.handle.net/10889/24033 |
work_keys_str_mv |
AT kolōniasleōnidas anonnegativeleastsquaressolverformultiplerighthandsidesforapproximatingthenonnegativematrixfactorization AT kolōniasleōnidas epilytesproblēmatōnmēarnētikōnelachistōntetragōnōnmepolladexiamelēgiatēnprosengisētēsmēarnētikēsparagontopoiēsēsmētrōōn AT kolōniasleōnidas nonnegativeleastsquaressolverformultiplerighthandsidesforapproximatingthenonnegativematrixfactorization |
_version_ |
1771297129653862400 |
spelling |
nemertes-10889-240332022-11-29T10:02:38Z A nonnegative least squares solver for multiple right-hand sides for approximating the nonnegative matrix factorization Επιλυτές προβλημάτων μη αρνητικών ελαχίστων τετραγώνων με πολλά δεξιά μέλη για την προσέγγιση της μη αρνητικής παραγοντοποίησης μητρώων Κολώνιας, Λεωνίδας Kolonias, Leonidas Nonneggative Least Squares (NNLS) Nonnegative Matrix Factorization (NMF) Multiple right-hand sides Block Krylov subspaces Numerical linear algebra Μη αρνητικά ελάχιστα τετράγωνα Μη αρνητική παραγοντοποίηση μητρώων Πολλά δεξιά μέλη Μπλοκ υπόχωροι Krylov Nonnegative Least Squares (NNLS) problems, where the variables are restricted to take only nonnegative values, often arise in many applications and are also at the core of most approaches to solve the nonnegative matrix factorization (NMF), a low-rank matrix approximation problem with nonnegativity constraints. NMF is a data analysis technique used in a great variety of applications such as text mining, image processing, hyperspectral data analysis, computational biology, and clustering. In more detail, the nonnegative factors can be interpreted as data e.g., as images described by pixel intensities or texts represented by vectors of word counts. The mathematical formulation for NMF appears as a non-convex optimization problem, and various types of algorithms have been devised to solve the problem. The first goal of this thesis is to propose a new efficient, yet simple to implement, approach to solve nonnegative linear least squares problems for multiple right-hand sides. More precisely, we study and use properties of global algorithms for least squares problems which are then combined with rules that enforce nonnegativity and lead to novel techniques for solving the aforementioned problem by a flexible Krylov subspace method. Comparisons of the state of the art algorithms using datasets and examples that come from real life applications as well as those artificially generated show that the proposed new algorithm presents a satisfactory behaviour and in some cases outperforms existing ones in computational speed and accuracy. Our second goal is to study extensively the NMF, its properties and applications and dive into the existing algorithms and methodologies used in order to approximate a solution for it. Moreover, using our new approach, tuned to solve large scale nonnegative least squares problems for multiple right-hand sides we present a novel algorithm for NMF based on the alternating nonnegative least squares (ANLS) framework. Extensive experiments on document clustering, images and synthetic datasets indicate the effectiveness of our approach. Προβλήματα μη αρνητικών ελαχίστων τετραγώνων, όπου οι τιμές της λύσης περιορίζονται να είναι μόνο μη αρνητικές εμφανίζονται σε πολλες εφαρμογές, καθώς επίσης αποτελούν το κύριο πρόβλημα των περισσότερων επιλυτών για τη μη αρνητική παραγοντοποίηση μητρώων (NMF), μια παραγοντοποίση κατά την οποία ένα μητρώο διασπάται σε γινόμενο δύο άλλων πολύ μικρότερου βαθμού με μη αρνητικές τιμές. Η μη αρνητική παραγοντοποίηση είναι αποτελεί μια τεχνική ανάλυσης δεδομένων η οποία χρησιμοποιείται σε πληθώρα εφαρμογών όπως η εξόρυξη κειμένου, η επεξεργασία εικόνας, η υπερφασματική ανάλυση δεδομένων, η υπολογιστική βιολογία και η ομαδοποίηση. Αναλυτικότερα, οι μη αρνητικοί παράγοντες μπορούν να ερμηνευθούν ως δεδομένα, π.χ. ως εικόνες που περιγράφονται με εντάσεις εικονοστοιχείων ή κείμενα που αντιπροσωπεύονται από διανύσματα πλήθους λέξεων. Η μαθηματική διατύπωση για τη μη αρνητική παραγοντοποίηση εμφανίζεται ως ένα μη κυρτό πρόβλημα βελτιστοποίησης και μέχρι σήμερα έχουν προταθεί διάφοροι τύποι αλγορίθμων για την επίλυση της. Ο πρώτος στόχος αυτής της διπλωματικής εργασσίας είναι να παρουσιάσει μια νέα αποτελεσματική, αλλά απλή στην εφαρμογή, προσέγγιση για την επίλυση προβλημάτων μη αρνητικών ελαχίστων τετραγώνων για πολλά δεξιά μέλη. Πιο συγκεκριμένα, μελετώνται και χρησιμοποιούνται ιδιότητες καθολικών (global) αλγορίθμων για προβλήματα ελαχίστων τετραγώνων, οι οποίες στη συνέχεια συνδυάζονται με κανόνες που επιβάλλουν τη μη αρνητικότητα και οδηγούν σε μια νέα τεχνική για την επίλυση του προαναφερθέντος προβλήματος βασιζόμενη στους ευέλικτους υποχώρους Krylov. Συγκρίσεις με αλγορίθμους τελευταίας τεχνολογίας χρησιμοποιώντας σύνολα δεδομένων και παραδείγματα που προέρχονται τόσο από πραγματικές εφαρμογές καθώς και τεχνητά δεδομένα δείχνουν ότι ο προτεινόμενος νέος αλγόριθμος παρουσιάζει ικανοποιητική συμπεριφορά και σε ορισμένες περιπτώσεις υπερέχει των υπαρχόντων σε υπολογιστική ταχύτητα και ακρίβεια. Ο δεύτερος στόχος μας είναι να μελετήσουμε εκτενώς τη μη αρνητική παραγοντοποίηση, τόσο τις ιδιότητες και τις εφαρμογές της αλλά κυρίως τους υπάρχοντες αλγόριθμους και μεθοδολογίες που προτείνονται για την εξέυρεση λύσης. Επιπλέον, χρησιμοποιώντας τη νέα μας μέθοδο, προσαρμοσμένη για την επίλυση προβλημάτων μη αρνητικών ελαχίστων τετραγώνων μεγάλης κλίμακας για πολλά δεξιά μέλη, παρουσιάζουμε έναν νέο αλγόριθμο για το NMF που βασίζεται στο πλαίσιο εναλλασσόμενων μη αρνητικών ελαχίστων τετραγώνων (ANLS). Τέλος παρουσιάζονται εκτεταμένα πειράματα σχετικά με ομαδοποίηση εγγράφων και εικόνες αλλά και πειράματα σε συνθετικά σύνολα δεδομένων τα οποία υποδηλώνουν την αποτελεσματικότητα της προσέγγισής μας. 2022-11-16T11:28:23Z 2022-11-16T11:28:23Z 2022-11-04 https://hdl.handle.net/10889/24033 en Attribution 3.0 United States http://creativecommons.org/licenses/by/3.0/us/ application/pdf |