Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές
Ακολουθώντας τις πρόσφατες εξελίξεις στον χώρο της μηχανικής και της βαθιάς μάθησης έχει παρατηρηθεί μία τεχνολογική έκρηξη καθώς αναπτύχθηκαν τεχνικές από τα παραπάνω πεδία οι οποίες εκτελούν πολύπλοκες εργασίες όπως η αναγνώριση αντικειμένων και η κατηγοριοποίηση εικόνων με πρωτοφανή για τα τεχνολ...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/16256 |
id |
nemertes-10889-16256 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Μηχανική μάθηση Κατανεμημένη μηχανική μάθηση Συνεργατική μάθηση Συστήματα πολλαπλών πρακτόρων Πλήρως κατανεμημένη μηχανική μάθηση Machine learning Distributed machine learning Federated learning Multi-agent systems Diffusion Consensus Edge machine learning Fully distributed machine learning |
spellingShingle |
Μηχανική μάθηση Κατανεμημένη μηχανική μάθηση Συνεργατική μάθηση Συστήματα πολλαπλών πρακτόρων Πλήρως κατανεμημένη μηχανική μάθηση Machine learning Distributed machine learning Federated learning Multi-agent systems Diffusion Consensus Edge machine learning Fully distributed machine learning Γεωργάτος, Ευάγγελος Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
description |
Ακολουθώντας τις πρόσφατες εξελίξεις στον χώρο της μηχανικής και της βαθιάς μάθησης έχει παρατηρηθεί μία τεχνολογική έκρηξη καθώς αναπτύχθηκαν τεχνικές από τα παραπάνω πεδία οι οποίες εκτελούν πολύπλοκες εργασίες όπως η αναγνώριση αντικειμένων και η κατηγοριοποίηση εικόνων με πρωτοφανή για τα τεχνολογικά δεδομένα απόδοση. Μάλιστα, οι συγκεκριμένες τεχνικές έχουν εφαρμογή σε πλήθος πεδίων όπως τα αυτόνομα οχήματα, η ιατρική απεικόνιση και οι ασύρματες επικοινωνίες. Η «παραδοσιακή» προσέγγιση για την ανάπτυξη τέτοιων εφαρμογών απαιτεί την ύπαρξη μίας κεντρικής ισχυρής υπολογιστικής οντότητας η οποία έχει καθολική πρόσβαση στο σύνολο δεδομένων.
Πρόσφατα, παρατηρείται μία μετατόπιση από αυτή τη προσέγγιση προς την κατεύθυνση του Edge Machine Learning στην οποία η κεντρική υπολογιστική οντότητα συνεργάζεται με πλήθος άλλων κινητών συσκευών με τοπική υπολογιστική και αποθηκευτική δυνατότητα, υπό την βοήθεια ενός κεντρικού εξυπηρετητή. Το πεδίο του Federated Learning σχεδιάζει αλγορίθμους μάθησης, οι οποίοι αναπτύσσονται πάνω σε τέτοιες αρχιτεκτονικές. Παράλληλα to Federated Learning προσφέρει ένα επίπεδο ιδιωτικότητας στα τοπικά δεδομένα, καθώς χρησιμοποιεί ανταλλαγές παραμέτρων για την επικοινωνία των συσκευών με τον εξυπηρετητή.
Στο πλαίσιο του Edge ML υπάρχουν πολλοί πρακτικοί λόγοι για τους οποίους δεν είναι επιθυμητός ένας κεντρικός εξυπηρετητής. Επιπλέον, είναι δυνατόν να είναι ανέφικτη η επικοινωνία των κινητών συσκευών με κάποιο κεντρικό εξυπηρετητή. Λαμβάνοντας υπόψιν αυτό το γεγονός η συγκεκριμένη εργασία εστιάζει στη μελέτη πλήρως κατανεμημένων αλγορίθμων συνεργατικής μάθησης. Επιπλέον, είναι γνωστό ότι η απόδοση των αλγορίθμων συνεργατικής μάθησης μπορεί να προσεγγίσει αυτή των κεντρικοποιημένων συστημάτων όταν ισχύει η υπόθεση της ανεξαρτησίας και της πανομοιότυπης κατανομής των δεδομένων (IID assumption) στις συνεργαζόμενες συσκευές. Παρόλα αυτά, λόγω του τρόπου με τον οποίον παράγονται τα δεδομένα, η συγκεκριμένη υπόθεση είναι δύσκολο να ικανοποιηθεί σε συνθήκες κατανεμημένης μάθησης. Στο πλαίσιο του Federated Learning έχει μελετηθεί ως προς ένα βαθμό το πρόβλημα του χειρισμού non-IID δεδομένων και έχουν αναπτυχθεί τεχνικές μάθησης που ξεφεύγουν από την IID υπόθεση. Στο χώρο της πλήρους κατανεμημένης μάθησης, το πρόβλημα αυτό είναι ακόμα ανοικτό. Για τον λόγο αυτό, η εργασία αυτή εστιάζει από κοινού στο πρόβλημα της πλήρως κατανεμημένης μάθησης και του χειρισμού non-IID δεδομένων.
Το πρώτο κεφάλαιο αυτής της εργασίας μελετάει την κεντρικοποιημένη «παραδοσιακή» αρχιτεκτονική συστημάτων μηχανικής μάθησης και προβάλλει την αδυναμία της να υποστηρίξει την νέα γενιά συσκευών και εφαρμογών οι οποίες αναπτύσσονται όπως τα αυτόνομα οχήματα και οι εφαρμογές επαυξημένης και εικονικής πραγματικότητας. Ως εναλλακτική παρουσιάζεται το καινοτόμο μοντέλο του Edge ML το οποίο βασίζεται στο υπολογιστικό μοντέλο του Edge Computing. Παρουσιάζονται τόσο τα πλεονεκτήματα όσο και οι περιορισμοί αυτού του μοντέλου. Το δεύτερο κεφάλαιο εστιάζει στο πεδίο του Federated Learning, ως μία σχεδιαστική προσέγγιση για τον σχεδιασμό αλγορίθμων συνεργατικής μάθησης, η οποία λαμβάνει υπόψιν τους περιορισμούς του Edge ML και υποστηρίζεται από έναν κεντρικό εξυπηρετητή. Παρουσιάζονται μέθοδοι Federated Learning, παρουσιάζεται το τυπικό πλαίσιο λειτουργίας αυτών και παρουσιάζονται ορισμένες ερευνητικές προκλήσεις του συγκεκριμένου πεδίου.
Το τρίτο κεφάλαιο είναι αφιερωμένο στην πλήρως κατανεμημένη μάθηση ως ενναλακτική της υποβοηθούμενης από κεντρικό εξυπηρετητή αντίληψης του Federated Learning. Στο πλαίσιο αυτό παρουσιάζονται οι τεχνικές της τεχνολογικής αιχμής Consensus και Diffusion. To τέταρτο κεφάλαιο μελετάει την συνεργατική μάθηση υπό το πρίσμα της non-IID κατανομής δεδομένων. Αρχικά, προβάλλεται ο τρόπος με τον οποίο η ύπαρξη non-IID δεδομένων υποβαθμίζει την διαδικασία της μάθησης και στη συνέχεια παρουσιάζεται η τεχνολογική αιχμή του πεδίου της πλήρως κατανεμημένης μάθησης υπό την παρουσία non-IID δεδομένων. Τέλος, παρουσιάζεται ένας αλγόριθμος πλήρους κατανεμημένης μάθησης ο οποίος βασίζεται στον αλγόριθμο Diffusion και χρησιμοποιεί προσαρμοστικά βάρη για τον χειρισμό των non-IID δεδομένων. Τέλος, στο πέμπτο κεφάλαιο παρουσιάζονται τα πειράματα και οι προσομοιώσεις που έγιναν στο πλαίσιο της παρούσης εργασίας. Ακολουθούν τα συμπεράσματα και οι προτεινόμενες μελλοντικές κατευθύνσεις. |
author2 |
Georgatos, Evangelos |
author_facet |
Georgatos, Evangelos Γεωργάτος, Ευάγγελος |
author |
Γεωργάτος, Ευάγγελος |
author_sort |
Γεωργάτος, Ευάγγελος |
title |
Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
title_short |
Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
title_full |
Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
title_fullStr |
Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
title_full_unstemmed |
Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
title_sort |
πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/16256 |
work_keys_str_mv |
AT geōrgatoseuangelos plērōskatanemēmenesstratēgikessynergatikēsmathēsēskaiepharmoges AT geōrgatoseuangelos serverlessstrategiesforfederatedlearningandapplications |
_version_ |
1771297314153955328 |
spelling |
nemertes-10889-162562022-09-05T20:17:54Z Πλήρως κατανεμημένες στρατηγικές συνεργατικής μάθησης και εφαρμογές Serverless strategies for federated learning and applications Γεωργάτος, Ευάγγελος Georgatos, Evangelos Μηχανική μάθηση Κατανεμημένη μηχανική μάθηση Συνεργατική μάθηση Συστήματα πολλαπλών πρακτόρων Πλήρως κατανεμημένη μηχανική μάθηση Machine learning Distributed machine learning Federated learning Multi-agent systems Diffusion Consensus Edge machine learning Fully distributed machine learning Ακολουθώντας τις πρόσφατες εξελίξεις στον χώρο της μηχανικής και της βαθιάς μάθησης έχει παρατηρηθεί μία τεχνολογική έκρηξη καθώς αναπτύχθηκαν τεχνικές από τα παραπάνω πεδία οι οποίες εκτελούν πολύπλοκες εργασίες όπως η αναγνώριση αντικειμένων και η κατηγοριοποίηση εικόνων με πρωτοφανή για τα τεχνολογικά δεδομένα απόδοση. Μάλιστα, οι συγκεκριμένες τεχνικές έχουν εφαρμογή σε πλήθος πεδίων όπως τα αυτόνομα οχήματα, η ιατρική απεικόνιση και οι ασύρματες επικοινωνίες. Η «παραδοσιακή» προσέγγιση για την ανάπτυξη τέτοιων εφαρμογών απαιτεί την ύπαρξη μίας κεντρικής ισχυρής υπολογιστικής οντότητας η οποία έχει καθολική πρόσβαση στο σύνολο δεδομένων. Πρόσφατα, παρατηρείται μία μετατόπιση από αυτή τη προσέγγιση προς την κατεύθυνση του Edge Machine Learning στην οποία η κεντρική υπολογιστική οντότητα συνεργάζεται με πλήθος άλλων κινητών συσκευών με τοπική υπολογιστική και αποθηκευτική δυνατότητα, υπό την βοήθεια ενός κεντρικού εξυπηρετητή. Το πεδίο του Federated Learning σχεδιάζει αλγορίθμους μάθησης, οι οποίοι αναπτύσσονται πάνω σε τέτοιες αρχιτεκτονικές. Παράλληλα to Federated Learning προσφέρει ένα επίπεδο ιδιωτικότητας στα τοπικά δεδομένα, καθώς χρησιμοποιεί ανταλλαγές παραμέτρων για την επικοινωνία των συσκευών με τον εξυπηρετητή. Στο πλαίσιο του Edge ML υπάρχουν πολλοί πρακτικοί λόγοι για τους οποίους δεν είναι επιθυμητός ένας κεντρικός εξυπηρετητής. Επιπλέον, είναι δυνατόν να είναι ανέφικτη η επικοινωνία των κινητών συσκευών με κάποιο κεντρικό εξυπηρετητή. Λαμβάνοντας υπόψιν αυτό το γεγονός η συγκεκριμένη εργασία εστιάζει στη μελέτη πλήρως κατανεμημένων αλγορίθμων συνεργατικής μάθησης. Επιπλέον, είναι γνωστό ότι η απόδοση των αλγορίθμων συνεργατικής μάθησης μπορεί να προσεγγίσει αυτή των κεντρικοποιημένων συστημάτων όταν ισχύει η υπόθεση της ανεξαρτησίας και της πανομοιότυπης κατανομής των δεδομένων (IID assumption) στις συνεργαζόμενες συσκευές. Παρόλα αυτά, λόγω του τρόπου με τον οποίον παράγονται τα δεδομένα, η συγκεκριμένη υπόθεση είναι δύσκολο να ικανοποιηθεί σε συνθήκες κατανεμημένης μάθησης. Στο πλαίσιο του Federated Learning έχει μελετηθεί ως προς ένα βαθμό το πρόβλημα του χειρισμού non-IID δεδομένων και έχουν αναπτυχθεί τεχνικές μάθησης που ξεφεύγουν από την IID υπόθεση. Στο χώρο της πλήρους κατανεμημένης μάθησης, το πρόβλημα αυτό είναι ακόμα ανοικτό. Για τον λόγο αυτό, η εργασία αυτή εστιάζει από κοινού στο πρόβλημα της πλήρως κατανεμημένης μάθησης και του χειρισμού non-IID δεδομένων. Το πρώτο κεφάλαιο αυτής της εργασίας μελετάει την κεντρικοποιημένη «παραδοσιακή» αρχιτεκτονική συστημάτων μηχανικής μάθησης και προβάλλει την αδυναμία της να υποστηρίξει την νέα γενιά συσκευών και εφαρμογών οι οποίες αναπτύσσονται όπως τα αυτόνομα οχήματα και οι εφαρμογές επαυξημένης και εικονικής πραγματικότητας. Ως εναλλακτική παρουσιάζεται το καινοτόμο μοντέλο του Edge ML το οποίο βασίζεται στο υπολογιστικό μοντέλο του Edge Computing. Παρουσιάζονται τόσο τα πλεονεκτήματα όσο και οι περιορισμοί αυτού του μοντέλου. Το δεύτερο κεφάλαιο εστιάζει στο πεδίο του Federated Learning, ως μία σχεδιαστική προσέγγιση για τον σχεδιασμό αλγορίθμων συνεργατικής μάθησης, η οποία λαμβάνει υπόψιν τους περιορισμούς του Edge ML και υποστηρίζεται από έναν κεντρικό εξυπηρετητή. Παρουσιάζονται μέθοδοι Federated Learning, παρουσιάζεται το τυπικό πλαίσιο λειτουργίας αυτών και παρουσιάζονται ορισμένες ερευνητικές προκλήσεις του συγκεκριμένου πεδίου. Το τρίτο κεφάλαιο είναι αφιερωμένο στην πλήρως κατανεμημένη μάθηση ως ενναλακτική της υποβοηθούμενης από κεντρικό εξυπηρετητή αντίληψης του Federated Learning. Στο πλαίσιο αυτό παρουσιάζονται οι τεχνικές της τεχνολογικής αιχμής Consensus και Diffusion. To τέταρτο κεφάλαιο μελετάει την συνεργατική μάθηση υπό το πρίσμα της non-IID κατανομής δεδομένων. Αρχικά, προβάλλεται ο τρόπος με τον οποίο η ύπαρξη non-IID δεδομένων υποβαθμίζει την διαδικασία της μάθησης και στη συνέχεια παρουσιάζεται η τεχνολογική αιχμή του πεδίου της πλήρως κατανεμημένης μάθησης υπό την παρουσία non-IID δεδομένων. Τέλος, παρουσιάζεται ένας αλγόριθμος πλήρους κατανεμημένης μάθησης ο οποίος βασίζεται στον αλγόριθμο Diffusion και χρησιμοποιεί προσαρμοστικά βάρη για τον χειρισμό των non-IID δεδομένων. Τέλος, στο πέμπτο κεφάλαιο παρουσιάζονται τα πειράματα και οι προσομοιώσεις που έγιναν στο πλαίσιο της παρούσης εργασίας. Ακολουθούν τα συμπεράσματα και οι προτεινόμενες μελλοντικές κατευθύνσεις. Nowadays, data-driven, machine and deep learning approaches have provided unprecedented performance in various complex tasks, including image classification and object detection, and in a variety of application areas, like autonomous vehicles, medical imaging and wireless communications. Traditionally, such approaches have been deployed, along with the involved datasets, on standalone devices. Recently, a shift has been observed towards the so-called Edge Machine Learning, in which centralized architectures are adopted that allow multiple devices with local computational and storage resources to collaborate with the assistance of a centralized server. The well-known federated learning approach can utilize such architectures by allowing the exchange of only parameters with the server, while keeping the datasets private to each contributing device. There are many practical reasons why a centralized server might not be desirable in an Edge ML collaborative system. Also, it might be unfeasible for connected devices to establish communication with a central server. Taking these reasons into account this thesis focuses on studying fully distributed collaborative learning algorithms. Furthermore, it is well known that the performance of distributed learning algorithms is comparable with their centralized counterpart when the so-called IID assumption holds. However, in the distributed Edge ML scenarios this assumption is difficult to satisfy because of the way data are generated. The handling of non-IID data in federated learning has been studied to a certain extent and there are methods that are able to departure from IID assumption. However, this statement doesn’t hold for the case of fully distributed learning. Therefore, this work focuses on the study of the joint problem of fully distributed learning and non-IID data handling with respect to the limitations of Edge ML environment. The first chapter of this thesis studies the Centralized Machine Learning architecture and its limitations to support the new breed of intelligent devices and high-stake applications like autonomous systems and AR/VR applications. As an alternative, a novel system architecture is proposed called Edge ML, designed with the standards of Edge Computing. The advantages and the limitations of Edge ML are then described. The second chapter focuses on the case of Federated Learning, a design approach suitable for Edge ML collaborative learning, assisted by a central server. Federated Learning methods are presented, the typical Federated Learning process is discussed, and some basic research challenges of the field are presented. The third chapter is dedicated to fully distributed learning as an alternative to Federated Learning server assisted architecture. State-of-the-art algorithms Consensus and Diffusion are presented. The fourth chapter studies the topic of fully distributed learning under the non-IID data assumption. Firstly, the way non-IID data distributions degrade distributed training performance is discussed. A state-of-the-art discussion follows and finally a fully distributed learning algorithm is presented based on an adaptive weighting version of Diffusion algorithm that deals with non-IID data distributions. The fifth chapter describes the experiments and the simulations that were carried out accompanied with explanations. Finally, the results of this thesis are summarized and future directions are proposed. 2022-06-20T09:39:12Z 2022-06-20T09:39:12Z 2022-06-20 http://hdl.handle.net/10889/16256 gr application/pdf |