Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing
Η συσταδοποίηση δικτύων είναι ένα ανοιχτό πρόβλημα σε πολλούς τομείς, όπως στην ανάλυση βιολογικών δικτύων, δικτύων τηλεπικοινωνιών αλλά και σε κάθε πρόβλημα που μπορεί να μοντελοποιηθεί με χρήση δικτύων. Η συσταδοποίηση δικτύων μεγάλης κλίμακας, όπως είναι τα δίκτυα μοριακής βιολογίας, είναι μια...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2019
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/12107 |
id |
nemertes-10889-12107 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Συσταδοποίηση δικτύων Βιολογικά δίκτυα Δίκτυα Σύμπλοκα Network clustering Biological networks Networks Complexes 006.3 |
spellingShingle |
Συσταδοποίηση δικτύων Βιολογικά δίκτυα Δίκτυα Σύμπλοκα Network clustering Biological networks Networks Complexes 006.3 Γιαννούλης, Κωνσταντίνος Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
description |
Η συσταδοποίηση δικτύων είναι ένα ανοιχτό πρόβλημα σε πολλούς τομείς, όπως στην ανάλυση βιολογικών δικτύων, δικτύων τηλεπικοινωνιών αλλά και σε κάθε πρόβλημα που μπορεί να μοντελοποιηθεί με χρήση δικτύων.
Η συσταδοποίηση δικτύων μεγάλης κλίμακας, όπως είναι τα δίκτυα μοριακής βιολογίας, είναι μια πολύπλοκη διαδικασία που απαιτεί πολύ χρόνο και αυξημένο όγκο υπολογιστικών πόρων για να ολοκληρωθεί.
Με την παρούσα διπλωματική εργασία, παρουσιάζεται μια νέα μέθοδος παράλληλης συσταδοποίησης η οποία επεκτείνει τις υπάρχουσες μεθόδους συσταδοποίησης ClusterONE και Evolutionary Enhanced Markov Clustering (EEMC) με τη χρήση τεχνικών παραλληλοποίησης και Υπολογιστικού νέφους (Cloud Computing) με στόχο τον επιμερισμό του αρχικού προβλήματος συσταδοποίησης σε μικρότερες εργασίες συσταδοποίησης και την κατανομή τους σε υπολογιστικούς πόρους προσφερόμενους από μια υποδομή Υπολογιστικού Νέφους. Ο τελικός στόχος είναι η επίτευξη καλύτερης χρονικής απόδοσης σε σύγκριση με πολύπλοκες μεθόδους συσταδοποίησης όπως ο EEMC.
Πιο συγκεκριμένα το νέο σύστημα που υλοποιήθηκε για την παρούσα εργασία, αρχικά δέχεται από το χρήστη τα δεδομένα εισόδου που περιγράφουν ένα δίκτυο και εφαρμόζει σε αυτό τεχνικές διαμερισμού ώστε να προκύψουν μικρότερα συνεκτικά υποδίκτυα. Ακολούθως, τα παραγόμενα υποδίκτυα προωθούνται σε ένα σύνολο Εικονικών Μηχανών (Virtual Machines), όπου υποβάλλονται σε διαδικασία συσταδοποίησης. Τέλος, τα επιμέρους αποτελέσματα συνενώνονται σε ένα τελικό αρχείο εξόδου που περιέχει όλες τις προβλεπόμενες συστάδες. Το νέο αυτό σύστημα εκμεταλλευόμενο την τεχνολογία υπολογιστικού νέφους, προσφέρει τη δυνατότητα επέκτασης (scalability) με στόχο τη βελτίωση της χρονικής απόδοσής του.
Για την κατανόηση της απόδοσης της μεθόδου παράλληλης συσταδοποίησης με χρήση υπολογιστικού νέφους, πραγματοποιήθηκαν πειραματικές εφαρμογές σε γνωστά βιολογικά δίκτυα και οι μετρικές χρονικής απόδοσης και ακρίβειας συγκρίθηκαν με αντίστοιχες άλλων γνωστών μεθοδολογιών συσταδοποίησης. Επιπλέον πραγματοποιήθηκαν μετρήσεις που καταδεικνύουν το ποσοστό βελτίωσης της χρονικής απόδοσης του συστήματος σε σχέση με το μέγεθος των πόρων που προστίθενται για την επέκταση του συστήματος. |
author2 |
Λυκοθανάσης, Σπυρίδων |
author_facet |
Λυκοθανάσης, Σπυρίδων Γιαννούλης, Κωνσταντίνος |
format |
Thesis |
author |
Γιαννούλης, Κωνσταντίνος |
author_sort |
Γιαννούλης, Κωνσταντίνος |
title |
Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
title_short |
Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
title_full |
Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
title_fullStr |
Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
title_full_unstemmed |
Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
title_sort |
σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing |
publishDate |
2019 |
url |
http://hdl.handle.net/10889/12107 |
work_keys_str_mv |
AT giannoulēskōnstantinos schediasmoskaiylopoiēsēalgorithmikēsmethodologiassystadopoiēsēsdiktyōnmechrēsētechnologiōncloudcomputing AT giannoulēskōnstantinos designandimplementationofanalgorithmicmethodologyfornetworkclusteringwithuseofcloudtechnologies |
_version_ |
1771297287848329217 |
spelling |
nemertes-10889-121072022-09-05T20:16:51Z Σχεδιασμός και υλοποίηση αλγοριθμικής μεθοδολογίας συσταδοποίησης δικτύων με χρήση τεχνολογιών cloud computing Design and implementation of an algorithmic methodology for network clustering with use of cloud technologies Γιαννούλης, Κωνσταντίνος Λυκοθανάσης, Σπυρίδων Λυκοθανάσης, Σπυρίδων Παυλίδης, Γεώργιος Χατζηλυγερούδης, Ιωάννης Giannoulis, Konstantinos Συσταδοποίηση δικτύων Βιολογικά δίκτυα Δίκτυα Σύμπλοκα Network clustering Biological networks Networks Complexes 006.3 Η συσταδοποίηση δικτύων είναι ένα ανοιχτό πρόβλημα σε πολλούς τομείς, όπως στην ανάλυση βιολογικών δικτύων, δικτύων τηλεπικοινωνιών αλλά και σε κάθε πρόβλημα που μπορεί να μοντελοποιηθεί με χρήση δικτύων. Η συσταδοποίηση δικτύων μεγάλης κλίμακας, όπως είναι τα δίκτυα μοριακής βιολογίας, είναι μια πολύπλοκη διαδικασία που απαιτεί πολύ χρόνο και αυξημένο όγκο υπολογιστικών πόρων για να ολοκληρωθεί. Με την παρούσα διπλωματική εργασία, παρουσιάζεται μια νέα μέθοδος παράλληλης συσταδοποίησης η οποία επεκτείνει τις υπάρχουσες μεθόδους συσταδοποίησης ClusterONE και Evolutionary Enhanced Markov Clustering (EEMC) με τη χρήση τεχνικών παραλληλοποίησης και Υπολογιστικού νέφους (Cloud Computing) με στόχο τον επιμερισμό του αρχικού προβλήματος συσταδοποίησης σε μικρότερες εργασίες συσταδοποίησης και την κατανομή τους σε υπολογιστικούς πόρους προσφερόμενους από μια υποδομή Υπολογιστικού Νέφους. Ο τελικός στόχος είναι η επίτευξη καλύτερης χρονικής απόδοσης σε σύγκριση με πολύπλοκες μεθόδους συσταδοποίησης όπως ο EEMC. Πιο συγκεκριμένα το νέο σύστημα που υλοποιήθηκε για την παρούσα εργασία, αρχικά δέχεται από το χρήστη τα δεδομένα εισόδου που περιγράφουν ένα δίκτυο και εφαρμόζει σε αυτό τεχνικές διαμερισμού ώστε να προκύψουν μικρότερα συνεκτικά υποδίκτυα. Ακολούθως, τα παραγόμενα υποδίκτυα προωθούνται σε ένα σύνολο Εικονικών Μηχανών (Virtual Machines), όπου υποβάλλονται σε διαδικασία συσταδοποίησης. Τέλος, τα επιμέρους αποτελέσματα συνενώνονται σε ένα τελικό αρχείο εξόδου που περιέχει όλες τις προβλεπόμενες συστάδες. Το νέο αυτό σύστημα εκμεταλλευόμενο την τεχνολογία υπολογιστικού νέφους, προσφέρει τη δυνατότητα επέκτασης (scalability) με στόχο τη βελτίωση της χρονικής απόδοσής του. Για την κατανόηση της απόδοσης της μεθόδου παράλληλης συσταδοποίησης με χρήση υπολογιστικού νέφους, πραγματοποιήθηκαν πειραματικές εφαρμογές σε γνωστά βιολογικά δίκτυα και οι μετρικές χρονικής απόδοσης και ακρίβειας συγκρίθηκαν με αντίστοιχες άλλων γνωστών μεθοδολογιών συσταδοποίησης. Επιπλέον πραγματοποιήθηκαν μετρήσεις που καταδεικνύουν το ποσοστό βελτίωσης της χρονικής απόδοσης του συστήματος σε σχέση με το μέγεθος των πόρων που προστίθενται για την επέκταση του συστήματος. Network clustering is an open problem in several domains of science like biological networks, telecommunication networks and any other problem that can be modeled as network. Clustering of huge-scale networks, like the biomolecular networks, is a complex process that demands a lot of time and increased amount of computational resources for its completion. In the current thesis, a new method of parallel clustering is introduced, which expands the already existing ClusterONE and Evolutionary Enhanced Markov Clustering (EEMC) with use of parallelization techniques and Cloud Computing and aims to reduce the initial clustering problem to smaller clustering jobs and distribute them in computational resources provided by a Cloud Computing infrastructure. The end goal is to achieve better performance compared to complex clustering methods like EEMC. More specifically, the new system that was implemented for the needs of this thesis, initially receives from the user the input data that represent a network in the form of a graph and applies in them partitioning techniques in order to produce smaller connected sub-networks (subgraphs). Then, the produced sub-networks are distributed to a set of Virtual Machines which perform the task of clustering. Finally, all the results from the clustering jobs are merged to produce a final output file which contains all the predicted clusters. This new system also offers scalability to the user, by taking advantage of cloud technologies, with the purpose of reducing the execution time that is required for clustering a network. For the understanding of the performance of the new parallel clustering method with use of cloud computing, a series of experimental applications on known biological networks have been performed and time and accuracy metrics have been calculated and compared to ones coming from other well-known clustering methods. Additionally, a series of measurements have been taken that show the effect of the expansion of the parallel clustering system in performance on the amount of computational resources used. 2019-03-29T21:53:45Z 2019-03-29T21:53:45Z 2018-12-17 Thesis http://hdl.handle.net/10889/12107 gr 0 application/pdf |