Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής

Στις σύγχρονες εφαρμογές που βασίζονται σε αλγορίθμους ανάλυσης δεδομένων, όπως η ομαδοποίηση, έχει γίνει απαραίτητη η χρήση πόρων της υπολογιστικής υψηλών επιδόσεων (high performance computing ή ΗPC), καθώς οι κλίμακες των προβλημάτων έχουν αυξηθεί δραματικά. Πρόσφατες αρχιτεκτονικές υπολογιστικών...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Αναγνώστου, Γεώργιος
Άλλοι συγγραφείς: Γαλλόπουλος, Ευστράτιος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13385
id nemertes-10889-13385
record_format dspace
spelling nemertes-10889-133852022-09-05T13:59:33Z Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής A study of numerical accuracy and stability of clustering algorithms in floating point arithmetic Αναγνώστου, Γεώργιος Γαλλόπουλος, Ευστράτιος Μεγαλοοικονόμου, Βασίλειος Ψαράκης, Εμμανουήλ Anagnostou, Georgios Ομαδοποίηση Μισή ακρίβεια Ευστάθεια Κινητή υποδιαστολή Ακρίβεια Ανάλυση δεδομένων Clustering Half - precision Stability Floating point Accuracy Data analysis Στις σύγχρονες εφαρμογές που βασίζονται σε αλγορίθμους ανάλυσης δεδομένων, όπως η ομαδοποίηση, έχει γίνει απαραίτητη η χρήση πόρων της υπολογιστικής υψηλών επιδόσεων (high performance computing ή ΗPC), καθώς οι κλίμακες των προβλημάτων έχουν αυξηθεί δραματικά. Πρόσφατες αρχιτεκτονικές υπολογιστικών μονάδων προσφέρουν εξαιρετικά υψηλές επιδόσεις στους υπολογισμούς, ιδιαίτερα αν οι εφαρμογές είναι ανεκτικές ως προς τα σφάλματα που υπάρχουν σε αυτούς. Αυτό επιτυγχάνεται με την υλοποίηση στις σύγχρονες αυτές υπολογιστικές μονάδες, αριθμητικής κινητής υποδιαστολής μειωμένης ακρίβειας και τη χρήση της αποκλειστικά ή σε μέρος των εφαρμογών. Επομένως, καθίσταται κρίσιμη η διερεύνηση των χαρακτηριστικών των αλγορίθμων και της επίδρασης των αριθμητικών σφαλμάτων στα αποτελέσματα που υπολογίζουν. Η παρούσα Διπλωματική Εργασία συνεισφέρει σ' αυτήν την κατεύθυνση διερευνώντας ορισμένους αλγορίθμους ομαδοποίησης και τη λειτουργία τους χρησιμοποιώντας προσομοιώσεις αριθμητικής μισής ακρίβειας (half precision arithmetic) σε περιβάλλον MATLAB. Αρχικά, γίνεται μία επισκόπηση της αριθμητικής κινητής υποδιαστολής, των υλοποιήσεων της μισής ακρίβειας σε κάρτες γραφικών νέων αρχιτεκτονικών, καθώς και μία συζήτηση για τη χρήση μεικτής ακρίβειας σε υπολογισμούς και των εργαλείων προσομοίωσης αριθμητικής μισής ακρίβειας σε MATLAB. Στη συνέχεια, επιχειρείται μία ειδική επέκταση της έννοιας της πίσω ευστάθειας (backward stability) για αλγορίθμους ομαδοποίησης καθώς και διερεύνηση της ευαισθησίας των αποτελεσμάτων ως προς ορισμένες αλλαγές στα δεδομένα. Η εργασία εστιάζει σε τρεις αλγορίθμους ομαδοποίησης. Αυτοί είναι ο ιεραρχικός διαιρετικός αλγόριθμος PDDP, ο διαχωριστικός αλγόριθμος K-means και ο υβριδικός αλγόριθμος PDDP-2means. Η μελέτη της πίσω ευστάθειας των αλγορίθμων πραγματοποιείται με την προσομοίωση αριθμητικής μισής ακρίβειας σε απευθείας σύγκριση με την εκτέλεσή τους σε αριθμητική διπλής ακρίβειας. Επιπλέον, επεκτείνεται μέσω του συνδυασμού της αριθμητικής μειωμένης ακρίβειας και της εναλλαγής συνθηκών αρχικοποίησης των αλγορίθμων. Τα αποτελέσματα προκύπτουν μέσα από μία σειρά πειραμάτων και ακολουθεί η αξιολόγησή τους και η καταγραφή συμπερασμάτων. Δεδομένου ότι η εν λόγω ακρίβεια έχει εισαχθεί στο πρότυπο IEEE 754-2008 ως binary-16 και υλοποιείται σε πρόσφατες κάρτες γραφικών όπως τα V100 και T4 της NVIDIA, που στοχεύουν σε εφαρμογές ανάλυσης δεδομένων και τεχνητής νοημοσύνης, η παρούσα εργασία αναμένεται να διευκολύνει τη μελέτη της επίδοσης και ακρίβειας αλγορίθμων στα εν λόγω συστήματα. - 2020-03-25T20:51:40Z 2020-03-25T20:51:40Z 2020-03-12 Thesis http://hdl.handle.net/10889/13385 gr 0 application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ομαδοποίηση
Μισή ακρίβεια
Ευστάθεια
Κινητή υποδιαστολή
Ακρίβεια
Ανάλυση δεδομένων
Clustering
Half - precision
Stability
Floating point
Accuracy
Data analysis
spellingShingle Ομαδοποίηση
Μισή ακρίβεια
Ευστάθεια
Κινητή υποδιαστολή
Ακρίβεια
Ανάλυση δεδομένων
Clustering
Half - precision
Stability
Floating point
Accuracy
Data analysis
Αναγνώστου, Γεώργιος
Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
description Στις σύγχρονες εφαρμογές που βασίζονται σε αλγορίθμους ανάλυσης δεδομένων, όπως η ομαδοποίηση, έχει γίνει απαραίτητη η χρήση πόρων της υπολογιστικής υψηλών επιδόσεων (high performance computing ή ΗPC), καθώς οι κλίμακες των προβλημάτων έχουν αυξηθεί δραματικά. Πρόσφατες αρχιτεκτονικές υπολογιστικών μονάδων προσφέρουν εξαιρετικά υψηλές επιδόσεις στους υπολογισμούς, ιδιαίτερα αν οι εφαρμογές είναι ανεκτικές ως προς τα σφάλματα που υπάρχουν σε αυτούς. Αυτό επιτυγχάνεται με την υλοποίηση στις σύγχρονες αυτές υπολογιστικές μονάδες, αριθμητικής κινητής υποδιαστολής μειωμένης ακρίβειας και τη χρήση της αποκλειστικά ή σε μέρος των εφαρμογών. Επομένως, καθίσταται κρίσιμη η διερεύνηση των χαρακτηριστικών των αλγορίθμων και της επίδρασης των αριθμητικών σφαλμάτων στα αποτελέσματα που υπολογίζουν. Η παρούσα Διπλωματική Εργασία συνεισφέρει σ' αυτήν την κατεύθυνση διερευνώντας ορισμένους αλγορίθμους ομαδοποίησης και τη λειτουργία τους χρησιμοποιώντας προσομοιώσεις αριθμητικής μισής ακρίβειας (half precision arithmetic) σε περιβάλλον MATLAB. Αρχικά, γίνεται μία επισκόπηση της αριθμητικής κινητής υποδιαστολής, των υλοποιήσεων της μισής ακρίβειας σε κάρτες γραφικών νέων αρχιτεκτονικών, καθώς και μία συζήτηση για τη χρήση μεικτής ακρίβειας σε υπολογισμούς και των εργαλείων προσομοίωσης αριθμητικής μισής ακρίβειας σε MATLAB. Στη συνέχεια, επιχειρείται μία ειδική επέκταση της έννοιας της πίσω ευστάθειας (backward stability) για αλγορίθμους ομαδοποίησης καθώς και διερεύνηση της ευαισθησίας των αποτελεσμάτων ως προς ορισμένες αλλαγές στα δεδομένα. Η εργασία εστιάζει σε τρεις αλγορίθμους ομαδοποίησης. Αυτοί είναι ο ιεραρχικός διαιρετικός αλγόριθμος PDDP, ο διαχωριστικός αλγόριθμος K-means και ο υβριδικός αλγόριθμος PDDP-2means. Η μελέτη της πίσω ευστάθειας των αλγορίθμων πραγματοποιείται με την προσομοίωση αριθμητικής μισής ακρίβειας σε απευθείας σύγκριση με την εκτέλεσή τους σε αριθμητική διπλής ακρίβειας. Επιπλέον, επεκτείνεται μέσω του συνδυασμού της αριθμητικής μειωμένης ακρίβειας και της εναλλαγής συνθηκών αρχικοποίησης των αλγορίθμων. Τα αποτελέσματα προκύπτουν μέσα από μία σειρά πειραμάτων και ακολουθεί η αξιολόγησή τους και η καταγραφή συμπερασμάτων. Δεδομένου ότι η εν λόγω ακρίβεια έχει εισαχθεί στο πρότυπο IEEE 754-2008 ως binary-16 και υλοποιείται σε πρόσφατες κάρτες γραφικών όπως τα V100 και T4 της NVIDIA, που στοχεύουν σε εφαρμογές ανάλυσης δεδομένων και τεχνητής νοημοσύνης, η παρούσα εργασία αναμένεται να διευκολύνει τη μελέτη της επίδοσης και ακρίβειας αλγορίθμων στα εν λόγω συστήματα.
author2 Γαλλόπουλος, Ευστράτιος
author_facet Γαλλόπουλος, Ευστράτιος
Αναγνώστου, Γεώργιος
format Thesis
author Αναγνώστου, Γεώργιος
author_sort Αναγνώστου, Γεώργιος
title Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
title_short Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
title_full Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
title_fullStr Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
title_full_unstemmed Μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
title_sort μελέτη ακρίβειας και ευστάθειας αλγορίθμων ομαδοποίησης σε αριθμητική κινητής υποδιαστολής
publishDate 2020
url http://hdl.handle.net/10889/13385
work_keys_str_mv AT anagnōstougeōrgios meletēakribeiaskaieustatheiasalgorithmōnomadopoiēsēssearithmētikēkinētēsypodiastolēs
AT anagnōstougeōrgios astudyofnumericalaccuracyandstabilityofclusteringalgorithmsinfloatingpointarithmetic
_version_ 1771297247095422976