Περίληψη: | Τα χαρακτηριστικά της σύγχρονης εποχής καθιστούν αναγκαία την αποτελεσματική και άμεση επεξεργασία μιας πληθώρας δεδομένων, γεγονός που καθίσταται ιδιαίτερα δυσχερές λόγω του μεγάλου όγκου τους, των απαιτήσεων ευρυχωρίας, αλλά και της χρονοβόρας διαδικασίας που απαιτείται για ένα τέτοιο έργο. Η παρούσα διπλωματική εργασία επιχείρησε να παρουσιάσει έναν τελεσφόρο τρόπο επεξεργασίας δεδομένων, παρέχοντας διέξοδο στο επείγον αυτό πρόβλημα.
Αντικείμενο της διπλωματικής είναι να εξετάσει και να προσφέρει λύσεις στο πρόβλημα του υπολογισμού της CANDECOMP / PARAFAC (CP) αποδόμησης μεγάλων τανυστών με τη χρήση γραφικής μονάδας επεξεργαστή. Ο τρόπος που επιχειρήθηκε να διευθετήσουμε το πρόβλημα είναι μέσω της αξιοποίησης μιας εκπαιδευτικής τεχνικής, γνωστής ως Batch Gradient Decent, κυρίως λόγω του μεγάλου όγκου των δεδομένων που κληθήκαμε να διαχειριστούμε. Ο λόγος που η τεχνική αυτή κρίνεται ως η πλέον αποτελεσματική είναι το γεγονός ότι καταφέρνει να επιμερίσει το σύνολο των δεδομένων σε μικρότερα τμήματα, χωρίς ταυτόχρονα να απαιτείται μετά από κάθε επανάληψη ξεχωριστή ενημέρωση στο σύνολο των δεδομένων.
Στη διπλωματική εργασία αξιοποιήθηκε τόσο ο όρος του γινομένου Khatri-rao, όσο και το γινόμενο του Kronecker. Οι μετρήσεις που έγιναν κατέδειξαν την ανωτερότητα της εκτέλεσης με χρήση GPU από αυτή τη χρήση CPU, αφού έτσι η υλοποίηση γινόταν γρηγορότερα, με εξαίρεση βέβαια κάποιες μετρήσεις που απαιτούσαν ισχυρότερη μνήμη.
|