Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων
Ο αποτελεσματικός σχεδιασμός ενός νευρωνικού δικτύου αποτελεί μια διαδικασία ιδιαίτερα απαιτητική η οποία μέχρι σήμερα έχει αντιμετωπιστεί κυρίως ως μια "τέχνη" όπου η εμπειρία και η ικανότητα του σχεδιαστή τους παίζει σημαντικότατο ρόλο. Δεν υπάρχει δηλαδή κάποια καθιερωμένη τυποποιημέν...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14874 |
id |
nemertes-10889-14874 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-148742022-09-05T05:00:21Z Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων Bayesian optimization for the design of deep neural networks Γιαννάκης, Νικόλας Giannakis, Nikolas Μπαγεσιανή βελτιστοποίηση Νευρωνικά δίκτυα Βέλτιστες υπερπαράμετροι Bayesian optimisation Neural networks Ο αποτελεσματικός σχεδιασμός ενός νευρωνικού δικτύου αποτελεί μια διαδικασία ιδιαίτερα απαιτητική η οποία μέχρι σήμερα έχει αντιμετωπιστεί κυρίως ως μια "τέχνη" όπου η εμπειρία και η ικανότητα του σχεδιαστή τους παίζει σημαντικότατο ρόλο. Δεν υπάρχει δηλαδή κάποια καθιερωμένη τυποποιημένη διαδικασία που να επιτρέπει τον σχεδιασμό ενός νευρωνικού δικτύου χωρίς την επέμβαση του ανθρώπινου παράγοντα. Ο σχεδιασμός ενός νευρωνικού δικτύου έγκειται ουσιαστικά στην επιλογή υπερπαραμέτρων. Λόγω του ιδιαίτερα μεγάλου όμως αριθμού συνδυασμών των υπερπαραμέτρων αυτών η επιλογή ενός συνδυασμού που να αποδίδει ένα αποδοτικό νευρωνικό δίκτυο καθίσταται πολύ δύσκολη, εξ΄ ου και η προσέγγιση της ως τέχνη. Στην παρούσα εργασία επιχειρείται να προσεγγιστεί το πρόβλημα αυτό. Ο τρόπος που γίνεται αυτό είναι μέσω της θεώρησης της όλης διαδικασίας ως μιας κοστοβόρας και άγνωστης συνάρτησης. Ως είσοδο η συνάρτηση αυτή δέχεται συνδυασμούς υπερπαραμέτρων. Ως έξοδο αποδίδει μια μοναδική τιμή η οποία αποτελεί την εκτίμηση της αποδοτικότητας του δικτύου. Ο μόνος τρόπος που μπορεί να επηρεαστεί η συνάρτηση είναι μέσω της αλλαγής της εισόδου της. Σκοπός μας είναι ως εκ τούτου η βελτιστοποίηση της συνάρτησης αυτής. ΄Ενα μαθηματικό εργαλείο που προσφέρεται για την βελτιστοποίηση τέτοιου είδους συναρτήσεων είναι η μπαγεσιανή βελτιστοποίηση. Με την χρήση της και την προσαρμογή της στα πλαίσια του σχεδιασμού νευρωνικών δικτύων επιχειρείται να τεθεί η διαδικασία αυτή σε ένα τυποποιημένο πλαίσιο όπου με ελάχιστη προσπάθεια θα παίρνουμε το καλύτερο δυνατό νευρωνικό δίκτυο για συγκεκριμένες υπερπαραμέτρους. ΄Οπως φαίνεται και στην πειραματική διαδικασία η χρήση της μπαγεσιανής βελτιστοποίησης είναι μια πολλά υποσχόμενη επιλογή για τον σχεδιασμό αποδοτικών νευρωνικών δικτύων αλλά και ένας τρόπος να σταματήσει ο σχεδιασμός τους να είναι μια μορφή τέχνης και να γίνει μια ελεγχόμενη και επαναλαμβανόμενη διαδικασία. The effective design of a neural network is a very demanding process that up to this point has been considered more a form of art, where the experience and skill of the designer plays a crucial role, than a scientifc and standardized process. That design process comes down to, effectively, choosing a set of hyperparameters that describe different aspects of the neural network. But because of the very big number of possible combinations of said hyperparameters, the task of choosing a specific combination that produces an efficient neural network proves very difficult, thus the approach of that task as an "art form". The aim of this thesis is to approach this problem and offer a solution. That solution is based on the consideration of the whole process of choosing a set of hyperparameters, applying them to produce a neural network and then assessing the efficiency of the produced network as costly, black box function. This function can only be infuenced by changing its inputs and gives as a result just a single value that expresses the efficiency of the produced neural network. Following the above assumptions it is clear that a mathemtaical tool o ers itself ideally as a solution. That tool is Bayesian optimisation of functions. Using Bayesian optimisation in context of designing neural networks attempts to approach that process methodically and eliminate the opinion based design as much as possible. That way it becomes possible to always have the best possible neural network given a set of constraints. As can be seen in this thesis' experiments, using Bayesian optimisation is a very promising methodology to design neural networks but also a way to make the whole process controlled and repeatable. 2021-06-29T08:51:04Z 2021-06-29T08:51:04Z 2021-03-22 http://hdl.handle.net/10889/14874 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μπαγεσιανή βελτιστοποίηση Νευρωνικά δίκτυα Βέλτιστες υπερπαράμετροι Bayesian optimisation Neural networks |
spellingShingle |
Μπαγεσιανή βελτιστοποίηση Νευρωνικά δίκτυα Βέλτιστες υπερπαράμετροι Bayesian optimisation Neural networks Γιαννάκης, Νικόλας Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
description |
Ο αποτελεσματικός σχεδιασμός ενός νευρωνικού δικτύου αποτελεί μια διαδικασία ιδιαίτερα απαιτητική η οποία μέχρι σήμερα έχει αντιμετωπιστεί κυρίως
ως μια "τέχνη" όπου η εμπειρία και η ικανότητα του σχεδιαστή τους παίζει
σημαντικότατο ρόλο. Δεν υπάρχει δηλαδή κάποια καθιερωμένη τυποποιημένη
διαδικασία που να επιτρέπει τον σχεδιασμό ενός νευρωνικού δικτύου χωρίς
την επέμβαση του ανθρώπινου παράγοντα. Ο σχεδιασμός ενός νευρωνικού
δικτύου έγκειται ουσιαστικά στην επιλογή υπερπαραμέτρων. Λόγω του ιδιαίτερα
μεγάλου όμως αριθμού συνδυασμών των υπερπαραμέτρων αυτών η επιλογή ενός
συνδυασμού που να αποδίδει ένα αποδοτικό νευρωνικό δίκτυο καθίσταται πολύ
δύσκολη, εξ΄ ου και η προσέγγιση της ως τέχνη.
Στην παρούσα εργασία επιχειρείται να προσεγγιστεί το πρόβλημα αυτό. Ο
τρόπος που γίνεται αυτό είναι μέσω της θεώρησης της όλης διαδικασίας ως μιας
κοστοβόρας και άγνωστης συνάρτησης. Ως είσοδο η συνάρτηση αυτή δέχεται
συνδυασμούς υπερπαραμέτρων. Ως έξοδο αποδίδει μια μοναδική τιμή η οποία
αποτελεί την εκτίμηση της αποδοτικότητας του δικτύου. Ο μόνος τρόπος που
μπορεί να επηρεαστεί η συνάρτηση είναι μέσω της αλλαγής της εισόδου της.
Σκοπός μας είναι ως εκ τούτου η βελτιστοποίηση της συνάρτησης αυτής.
΄Ενα μαθηματικό εργαλείο που προσφέρεται για την βελτιστοποίηση τέτοιου
είδους συναρτήσεων είναι η μπαγεσιανή βελτιστοποίηση. Με την χρήση της
και την προσαρμογή της στα πλαίσια του σχεδιασμού νευρωνικών δικτύων
επιχειρείται να τεθεί η διαδικασία αυτή σε ένα τυποποιημένο πλαίσιο όπου με
ελάχιστη προσπάθεια θα παίρνουμε το καλύτερο δυνατό νευρωνικό δίκτυο για
συγκεκριμένες υπερπαραμέτρους.
΄Οπως φαίνεται και στην πειραματική διαδικασία η χρήση της μπαγεσιανής
βελτιστοποίησης είναι μια πολλά υποσχόμενη επιλογή για τον σχεδιασμό αποδοτικών νευρωνικών δικτύων αλλά και ένας τρόπος να σταματήσει ο σχεδιασμός
τους να είναι μια μορφή τέχνης και να γίνει μια ελεγχόμενη και επαναλαμβανόμενη
διαδικασία. |
author2 |
Giannakis, Nikolas |
author_facet |
Giannakis, Nikolas Γιαννάκης, Νικόλας |
author |
Γιαννάκης, Νικόλας |
author_sort |
Γιαννάκης, Νικόλας |
title |
Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
title_short |
Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
title_full |
Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
title_fullStr |
Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
title_full_unstemmed |
Bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
title_sort |
bayesian βελτιστοποίηση υπερπαραμέτρων νευρωνικών δικτύων |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14874 |
work_keys_str_mv |
AT giannakēsnikolas bayesianbeltistopoiēsēyperparametrōnneurōnikōndiktyōn AT giannakēsnikolas bayesianoptimizationforthedesignofdeepneuralnetworks |
_version_ |
1771297128266596352 |