Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU

Τα χαρακτηριστικά της σύγχρονης εποχής καθιστούν αναγκαία την αποτελεσματική και άμεση επεξεργασία μιας πληθώρας δεδομένων, γεγονός που καθίσταται ιδιαίτερα δυσχερές λόγω του μεγάλου όγκου τους, των απαιτήσεων ευρυχωρίας, αλλά και της χρονοβόρας διαδικασίας που απαιτείται για ένα τέτοιο έργο. Η παρο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Βουιδάσκης, Χαράλαμπος
Άλλοι συγγραφείς: Vouidaskis, Charalabos
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/15572
id nemertes-10889-15572
record_format dspace
spelling nemertes-10889-155722022-09-05T20:44:27Z Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU Tensor rank decomposition using GPU Βουιδάσκης, Χαράλαμπος Vouidaskis, Charalabos Τανυστές Αποδόμηση μεγάλων τανυστών Κάρτες γραφηκών Παρτίδες Tensors Decomposition of large tensors Gradient descent Batch size GPU Khatri-rao Kronecker Τα χαρακτηριστικά της σύγχρονης εποχής καθιστούν αναγκαία την αποτελεσματική και άμεση επεξεργασία μιας πληθώρας δεδομένων, γεγονός που καθίσταται ιδιαίτερα δυσχερές λόγω του μεγάλου όγκου τους, των απαιτήσεων ευρυχωρίας, αλλά και της χρονοβόρας διαδικασίας που απαιτείται για ένα τέτοιο έργο. Η παρούσα διπλωματική εργασία επιχείρησε να παρουσιάσει έναν τελεσφόρο τρόπο επεξεργασίας δεδομένων, παρέχοντας διέξοδο στο επείγον αυτό πρόβλημα. Αντικείμενο της διπλωματικής είναι να εξετάσει και να προσφέρει λύσεις στο πρόβλημα του υπολογισμού της CANDECOMP / PARAFAC (CP) αποδόμησης μεγάλων τανυστών με τη χρήση γραφικής μονάδας επεξεργαστή. Ο τρόπος που επιχειρήθηκε να διευθετήσουμε το πρόβλημα είναι μέσω της αξιοποίησης μιας εκπαιδευτικής τεχνικής, γνωστής ως Batch Gradient Decent, κυρίως λόγω του μεγάλου όγκου των δεδομένων που κληθήκαμε να διαχειριστούμε. Ο λόγος που η τεχνική αυτή κρίνεται ως η πλέον αποτελεσματική είναι το γεγονός ότι καταφέρνει να επιμερίσει το σύνολο των δεδομένων σε μικρότερα τμήματα, χωρίς ταυτόχρονα να απαιτείται μετά από κάθε επανάληψη ξεχωριστή ενημέρωση στο σύνολο των δεδομένων. Στη διπλωματική εργασία αξιοποιήθηκε τόσο ο όρος του γινομένου Khatri-rao, όσο και το γινόμενο του Kronecker. Οι μετρήσεις που έγιναν κατέδειξαν την ανωτερότητα της εκτέλεσης με χρήση GPU από αυτή τη χρήση CPU, αφού έτσι η υλοποίηση γινόταν γρηγορότερα, με εξαίρεση βέβαια κάποιες μετρήσεις που απαιτούσαν ισχυρότερη μνήμη. The large amount of data we want to process today is difficult to calculate at the right time and place. One way we can process them is through the study done in this thesis. This thesis examines the problem of estimating the CANDECOMP / PARAFAC (CP) decomposition of large tensors using a graphics processor unit. We implement it with the Batch Gradient Descent technique; due to the large volume of data, we had to use this training technique. This technique breaks the data set into smaller pieces without updating the data set separately after each iteration. In the thesis, we use the term Khatri-rao product and the Kronecker product. The measurements were made to show the differences between the performance using GPU and using CPU. One of the conclusions that came out is that the implementation with GPU is the fastest. Another conclusion was that some measurements could not be done with GPU because there was not enough memory to run. 2021-11-11T06:31:50Z 2021-11-11T06:31:50Z 2021-10-25 http://hdl.handle.net/10889/15572 gr application/pdf
institution UPatras
collection Nemertes
language Greek
topic Τανυστές
Αποδόμηση μεγάλων τανυστών
Κάρτες γραφηκών
Παρτίδες
Tensors
Decomposition of large tensors
Gradient descent
Batch size
GPU
Khatri-rao
Kronecker
spellingShingle Τανυστές
Αποδόμηση μεγάλων τανυστών
Κάρτες γραφηκών
Παρτίδες
Tensors
Decomposition of large tensors
Gradient descent
Batch size
GPU
Khatri-rao
Kronecker
Βουιδάσκης, Χαράλαμπος
Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
description Τα χαρακτηριστικά της σύγχρονης εποχής καθιστούν αναγκαία την αποτελεσματική και άμεση επεξεργασία μιας πληθώρας δεδομένων, γεγονός που καθίσταται ιδιαίτερα δυσχερές λόγω του μεγάλου όγκου τους, των απαιτήσεων ευρυχωρίας, αλλά και της χρονοβόρας διαδικασίας που απαιτείται για ένα τέτοιο έργο. Η παρούσα διπλωματική εργασία επιχείρησε να παρουσιάσει έναν τελεσφόρο τρόπο επεξεργασίας δεδομένων, παρέχοντας διέξοδο στο επείγον αυτό πρόβλημα. Αντικείμενο της διπλωματικής είναι να εξετάσει και να προσφέρει λύσεις στο πρόβλημα του υπολογισμού της CANDECOMP / PARAFAC (CP) αποδόμησης μεγάλων τανυστών με τη χρήση γραφικής μονάδας επεξεργαστή. Ο τρόπος που επιχειρήθηκε να διευθετήσουμε το πρόβλημα είναι μέσω της αξιοποίησης μιας εκπαιδευτικής τεχνικής, γνωστής ως Batch Gradient Decent, κυρίως λόγω του μεγάλου όγκου των δεδομένων που κληθήκαμε να διαχειριστούμε. Ο λόγος που η τεχνική αυτή κρίνεται ως η πλέον αποτελεσματική είναι το γεγονός ότι καταφέρνει να επιμερίσει το σύνολο των δεδομένων σε μικρότερα τμήματα, χωρίς ταυτόχρονα να απαιτείται μετά από κάθε επανάληψη ξεχωριστή ενημέρωση στο σύνολο των δεδομένων. Στη διπλωματική εργασία αξιοποιήθηκε τόσο ο όρος του γινομένου Khatri-rao, όσο και το γινόμενο του Kronecker. Οι μετρήσεις που έγιναν κατέδειξαν την ανωτερότητα της εκτέλεσης με χρήση GPU από αυτή τη χρήση CPU, αφού έτσι η υλοποίηση γινόταν γρηγορότερα, με εξαίρεση βέβαια κάποιες μετρήσεις που απαιτούσαν ισχυρότερη μνήμη.
author2 Vouidaskis, Charalabos
author_facet Vouidaskis, Charalabos
Βουιδάσκης, Χαράλαμπος
author Βουιδάσκης, Χαράλαμπος
author_sort Βουιδάσκης, Χαράλαμπος
title Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
title_short Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
title_full Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
title_fullStr Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
title_full_unstemmed Τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας GPU
title_sort τανυστική αποδόμηση με χρήση γραφικής μονάδας επεξεργασίας gpu
publishDate 2021
url http://hdl.handle.net/10889/15572
work_keys_str_mv AT bouidaskēscharalampos tanystikēapodomēsēmechrēsēgraphikēsmonadasepexergasiasgpu
AT bouidaskēscharalampos tensorrankdecompositionusinggpu
_version_ 1771297353160982528