Ομαδοποίηση δεδομένων υψηλής διάστασης

Η ομαδοποίηση ομαδοποιεί τα δεδομένα βασισμένη μόνο σε πληροφορία που βρίσκεται σε αυτά η οποία περιγράφει τα αντικείμενα και τις σχέσεις τους. Ο στόχος είναι τα αντικείμενα που βρίσκονται σε μια ομάδα να είναι όμοια(ή σχετικά) μεταξύ τους και διαφορετικά απο τα αντικείμενα των άλλων ομάδων. Όσο με...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας:	Τασουλής, Σωτήρης
Άλλοι συγγραφείς:	Βραχάτης, Μιχαήλ
Μορφή:	Thesis
Γλώσσα:	Greek
Έκδοση:	2009
Θέματα:	Ομαδοποίηση Διάσπαση ιδιάζουσων τιμών Αναγνώριση προτύπων Ανάλυση πρωτευουσών συνιστωσών Clustering Singular value decomposition Pattern recognition Principal component analysis 519.53
Διαθέσιμο Online:	http://nemertes.lis.upatras.gr/jspui/handle/10889/2001

id	nemertes-10889-2001
record_format	dspace
spelling	nemertes-10889-20012022-09-05T05:00:26Z Ομαδοποίηση δεδομένων υψηλής διάστασης Τασουλής, Σωτήρης Βραχάτης, Μιχαήλ Αλεβίζος, Παναγώτης Πλαγιανάκος, Βασίλης Βραχάτης, Μιχαήλ Tasoulis, Sotiris Ομαδοποίηση Διάσπαση ιδιάζουσων τιμών Αναγνώριση προτύπων Ανάλυση πρωτευουσών συνιστωσών Clustering Singular value decomposition Pattern recognition Principal component analysis 519.53 Η ομαδοποίηση ομαδοποιεί τα δεδομένα βασισμένη μόνο σε πληροφορία που βρίσκεται σε αυτά η οποία περιγράφει τα αντικείμενα και τις σχέσεις τους. Ο στόχος είναι τα αντικείμενα που βρίσκονται σε μια ομάδα να είναι όμοια(ή σχετικά) μεταξύ τους και διαφορετικά απο τα αντικείμενα των άλλων ομάδων. Όσο μεγαλύτερη είναι η ομοιότητα(ή η ομοιογένεια) σε μια ομάδα και όσο μεγαλύτερη είναι η διαφορετικότητα ανάμεσα στις ομάδες τόσο καλύτερη είναι η ομαδοποίηση. Οι μεθόδοι ομαδοποίησης μπορούν να διακριθούν σε τρείς κατηγορίες, ιεραρχικές, διαχωριστικές, και στις βασισμένες στη πυκνότητα. Οι ιεραρχικοί αλγόριθμοι μας δίνουν ιεραρχίες ομάδων σε μία top-down(συγχωνευτική) ή bottom-up(διαχωριστική) μορφή. Η εργασία αυτή επικεντρώνεται στην ιεραρχική διαχωριστική ομαδοποίηση. Ανάμεσα στους ιεραρχικούς διαχωριστικούς αλγορίθμους ξεχωρίζουμε τον αλγόριθμο Principal Direction Divisive Partitioning (PDDP). Ο PDDP χρησιμοποιεί την προβολή των δεδομένων στα κύρια συστατικά της αντίστοιχης μήτρας συνδιασποράς. Αυτό επιτρέπει την εφαρμογή σε δεδομένα υψηλής διάστασης. Στην εργασία αυτή προτείνεται μια βελτίωση του αλγορίθμου \Principal Direction Divisive Partitioning. Ο προτεινόμενος αλγόριθμος συνδυάζει στοιχεία από την εκτίμηση πυκνότητας και τις μεθόδους βασισμένες στην προβολή με έναν γρήγορο και αποδοτικό αλγόριθμο, ικανό να αντιμετωπίσει δεδομένα υψηλής διάστασης. Τα πειραματικά αποτελέσματα δείχνουν βελτιωμένη απόδοση ομαδοποίησης σε σύγκριση με άλλες δημοφιλείς μεθόδους. Επίσης ερευνάται το πρόβλημα του αυτόματου καθορισμού του πλήθους των ομάδων που είναι πολύ σημαντικό την ανάλυση ομάδων. Cluster analysis groups data objects based only on information found in the data that describes the objects and their relationships. The goal is that the objects within a group be similar (or related) to one another and different from (or unrelated to) the objects in other groups. The greater the similarity (or homogeneity) within a group and the greater the difference between groups, the better or more distinct the clustering. Clustering methods can be broadly divided into three categories, hierarchical, partitioning and density-based (while there are other categorisations). Hierarchical algorithms provide nested hierarchies of clusters in a top-down (agglomerative), or bottom-up (divisive) fashion. This work is focused on the class of hierarchical divisive clustering algorithms. Amongst the class of divisive hierarchical algorithms, the Principal Direction Divisive Partitioning (PDDP) algorithm is of particular value. PDDP uses the projection of the data onto the principal components of the associated data covariance matrix. This allows the application to high dimensional data. In this work an improvement of the algorithm PDDP is proposed. The proposed algorithm merges concepts from density estimation and projection-based methods towards a fast and efficient clustering algorithm, capable of dealing with high dimensional data. Experimental results show improved partitioning performance compared to other popular methods. Moreover, we explore the problem of automatically determining the number of clusters that is central in cluster analysis. 2009-10-09T10:33:21Z 2009-10-09T10:33:21Z 2009-06-18 2009-10-09T10:33:21Z Thesis http://nemertes.lis.upatras.gr/jspui/handle/10889/2001 gr Η ΒKΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου. 0 application/pdf
institution	UPatras
collection	Nemertes
language	Greek
topic	Ομαδοποίηση Διάσπαση ιδιάζουσων τιμών Αναγνώριση προτύπων Ανάλυση πρωτευουσών συνιστωσών Clustering Singular value decomposition Pattern recognition Principal component analysis 519.53
spellingShingle	Ομαδοποίηση Διάσπαση ιδιάζουσων τιμών Αναγνώριση προτύπων Ανάλυση πρωτευουσών συνιστωσών Clustering Singular value decomposition Pattern recognition Principal component analysis 519.53 Τασουλής, Σωτήρης Ομαδοποίηση δεδομένων υψηλής διάστασης
description	Η ομαδοποίηση ομαδοποιεί τα δεδομένα βασισμένη μόνο σε πληροφορία που βρίσκεται σε αυτά η οποία περιγράφει τα αντικείμενα και τις σχέσεις τους. Ο στόχος είναι τα αντικείμενα που βρίσκονται σε μια ομάδα να είναι όμοια(ή σχετικά) μεταξύ τους και διαφορετικά απο τα αντικείμενα των άλλων ομάδων. Όσο μεγαλύτερη είναι η ομοιότητα(ή η ομοιογένεια) σε μια ομάδα και όσο μεγαλύτερη είναι η διαφορετικότητα ανάμεσα στις ομάδες τόσο καλύτερη είναι η ομαδοποίηση. Οι μεθόδοι ομαδοποίησης μπορούν να διακριθούν σε τρείς κατηγορίες, ιεραρχικές, διαχωριστικές, και στις βασισμένες στη πυκνότητα. Οι ιεραρχικοί αλγόριθμοι μας δίνουν ιεραρχίες ομάδων σε μία top-down(συγχωνευτική) ή bottom-up(διαχωριστική) μορφή. Η εργασία αυτή επικεντρώνεται στην ιεραρχική διαχωριστική ομαδοποίηση. Ανάμεσα στους ιεραρχικούς διαχωριστικούς αλγορίθμους ξεχωρίζουμε τον αλγόριθμο Principal Direction Divisive Partitioning (PDDP). Ο PDDP χρησιμοποιεί την προβολή των δεδομένων στα κύρια συστατικά της αντίστοιχης μήτρας συνδιασποράς. Αυτό επιτρέπει την εφαρμογή σε δεδομένα υψηλής διάστασης. Στην εργασία αυτή προτείνεται μια βελτίωση του αλγορίθμου \Principal Direction Divisive Partitioning. Ο προτεινόμενος αλγόριθμος συνδυάζει στοιχεία από την εκτίμηση πυκνότητας και τις μεθόδους βασισμένες στην προβολή με έναν γρήγορο και αποδοτικό αλγόριθμο, ικανό να αντιμετωπίσει δεδομένα υψηλής διάστασης. Τα πειραματικά αποτελέσματα δείχνουν βελτιωμένη απόδοση ομαδοποίησης σε σύγκριση με άλλες δημοφιλείς μεθόδους. Επίσης ερευνάται το πρόβλημα του αυτόματου καθορισμού του πλήθους των ομάδων που είναι πολύ σημαντικό την ανάλυση ομάδων.
author2	Βραχάτης, Μιχαήλ
author_facet	Βραχάτης, Μιχαήλ Τασουλής, Σωτήρης
format	Thesis
author	Τασουλής, Σωτήρης
author_sort	Τασουλής, Σωτήρης
title	Ομαδοποίηση δεδομένων υψηλής διάστασης
title_short	Ομαδοποίηση δεδομένων υψηλής διάστασης
title_full	Ομαδοποίηση δεδομένων υψηλής διάστασης
title_fullStr	Ομαδοποίηση δεδομένων υψηλής διάστασης
title_full_unstemmed	Ομαδοποίηση δεδομένων υψηλής διάστασης
title_sort	ομαδοποίηση δεδομένων υψηλής διάστασης
publishDate	2009
url	http://nemertes.lis.upatras.gr/jspui/handle/10889/2001
work_keys_str_mv	AT tasoulēssōtērēs omadopoiēsēdedomenōnypsēlēsdiastasēs
_version_	1771297124948901888

Ομαδοποίηση δεδομένων υψηλής διάστασης

Παρόμοια τεκμήρια