Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης

Hierarchical clustering is one of the most powerful solutions to the problem of clustering, on the grounds that it performs a multi scale organization of the data. In recent years, research on hierarchical clustering methods has attracted considerable interest due to the demanding modern application...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κορμπά, Αντωνία
Άλλοι συγγραφείς: Γαροφαλάκης, Ιωάννης
Μορφή: Thesis
Γλώσσα:English
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/11751
id nemertes-10889-11751
record_format dspace
spelling nemertes-10889-117512022-09-05T14:00:29Z Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης HSC : a novel method for clustering hierarchies of networked data Κορμπά, Αντωνία Γαροφαλάκης, Ιωάννης Γαροφαλάκης, Ιωάννης Γαλλόπουλος, Ευστράτιος Μεγαλοοικονόμου, Βασίλειος Korba, Antonia Hierarchical clustering Network clustering Stochastic complementation Double stochasticity Ιεραρχική συσταδοποίηση Συσταδοποίηση σε γραφήματα Στοχαστική συμπλήρωση Διπλή στοχαστικότητα 004.35 Hierarchical clustering is one of the most powerful solutions to the problem of clustering, on the grounds that it performs a multi scale organization of the data. In recent years, research on hierarchical clustering methods has attracted considerable interest due to the demanding modern application domains. We present a novel divisive hierarchical clustering framework called Hierarchical Stochastic Clustering (HSC), that acts in two stages. In the first stage, it finds a primary hierarchy of clustering partitions in a dataset. In the second stage, feeds a clustering algorithm with each one of the clusters of the very detailed partition, in order to settle the final result. The output is a hierarchy of clusters. Our method is based on the previous research of Meyer and Weissel \textit{Stochastic Data Clustering} and the theory of Simon and Ando on \textit{Variable Aggregation}. Our experiments show that our framework builds a meaningful hierarchy of clusters and benefits consistently the clustering algorithm that acts in the second stage, not only computationally but also in terms of cluster quality. This result suggest that HSC framework is ideal for obtaining hierarchical solutions of large volumes of data. Η ιεραρχική συσταδοποίηση είναι μια από τις πιο αποτελεσματικες λύσεις στο πρόβλημα της συσταδοποίησης δίοτι παρέχει οργάνωση πολλαπλών επιπέδων στα δεδομένα. Τα τελευταία χρόνια, η έρευνα που γίνεται σε αλγορίθμους ιεραρχικής συσταδοποίησης, προκαλεί μεγάλο ενδιαφέρον, λόγω των απαιτήσεων των σύγχρονων εφαρμογών. Προτείνουμε ένα νέο μοντέλο ιεραρχικής συσταδοποίησης, που ονομάζεται Hierarchical Stochastic Clustering (HSC), το οποίο δρά σε δύο στάδια. Στο πρώτο στάδιο, βρίσκει μια πρωταρχική ιεαραχία από διαμερίσεις σε ένα σύνολο δεδομένων. Στο δεύτερο στάδιο, τροφοδοτεί εναν αλγόριθμο συσταδοποίησης με καθέμια από τις συστάδες που ανήκουν στην πιό λεπτομερή διαμέριση, προκειμένου να εξαχθεί το τελικό αποτέλεσμα. Η μεθοδολογία που ακολουθήσαμε βασίζεται στην έρευνα \textit{Stochastic Data Clustering} των Meyer και Weissel αλλά και στην θεωρία \textit{Variable Aggregation} των Simon και Ando. Η πειραματική αξιολόγηση δείχνει πως το μοντέλο μας χτίζει μια ποιοτική ιεραρχία και βελτιώνει σταθερά τον αλγόριθμο που δρα στο δεύτερο στάδιο, όχι μόνο υπολογιστικά αλλά και ποιοτικά. Αυτό το αποτέλεσμα υπαγορεύει ότι η μέθοδος HSC είναι μια ιδανική λύση σε προβλήματα συσταδοποίησης μεγάλου όγκου δεδομένων. 2018-12-03T07:45:43Z 2018-12-03T07:45:43Z 2017-11-10 Thesis http://hdl.handle.net/10889/11751 en 0 application/pdf
institution UPatras
collection Nemertes
language English
topic Hierarchical clustering
Network clustering
Stochastic complementation
Double stochasticity
Ιεραρχική συσταδοποίηση
Συσταδοποίηση σε γραφήματα
Στοχαστική συμπλήρωση
Διπλή στοχαστικότητα
004.35
spellingShingle Hierarchical clustering
Network clustering
Stochastic complementation
Double stochasticity
Ιεραρχική συσταδοποίηση
Συσταδοποίηση σε γραφήματα
Στοχαστική συμπλήρωση
Διπλή στοχαστικότητα
004.35
Κορμπά, Αντωνία
Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
description Hierarchical clustering is one of the most powerful solutions to the problem of clustering, on the grounds that it performs a multi scale organization of the data. In recent years, research on hierarchical clustering methods has attracted considerable interest due to the demanding modern application domains. We present a novel divisive hierarchical clustering framework called Hierarchical Stochastic Clustering (HSC), that acts in two stages. In the first stage, it finds a primary hierarchy of clustering partitions in a dataset. In the second stage, feeds a clustering algorithm with each one of the clusters of the very detailed partition, in order to settle the final result. The output is a hierarchy of clusters. Our method is based on the previous research of Meyer and Weissel \textit{Stochastic Data Clustering} and the theory of Simon and Ando on \textit{Variable Aggregation}. Our experiments show that our framework builds a meaningful hierarchy of clusters and benefits consistently the clustering algorithm that acts in the second stage, not only computationally but also in terms of cluster quality. This result suggest that HSC framework is ideal for obtaining hierarchical solutions of large volumes of data.
author2 Γαροφαλάκης, Ιωάννης
author_facet Γαροφαλάκης, Ιωάννης
Κορμπά, Αντωνία
format Thesis
author Κορμπά, Αντωνία
author_sort Κορμπά, Αντωνία
title Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
title_short Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
title_full Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
title_fullStr Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
title_full_unstemmed Ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
title_sort ανάπτυξη νέου μοντέλου ιεραρχικής συσταδοποίησης
publishDate 2018
url http://hdl.handle.net/10889/11751
work_keys_str_mv AT kormpaantōnia anaptyxēneoumontelouierarchikēssystadopoiēsēs
AT kormpaantōnia hscanovelmethodforclusteringhierarchiesofnetworkeddata
_version_ 1771297249358249984