Περίληψη: | Ο βασικός στόχος αυτού του κεφαλαίου είναι η εξοικείωση με θέματα που αφορούν την τρίτη σημαντική εργασία της εξόρυξης δεδομένων, δηλαδή την ανάλυση των συστάδων. Πιο συγκεκριμένα, παρουσιάζονται μία σειρά από βασικοί ορισμοί αναφορικά με την ανάλυση συστάδων και την συσταδοποίηση, και εξετάζονται με λεπτομέρεια τρεις κατηγορίες τεχνικών συσταδοποίησης: η διαμεριστική συσταδοποίηση, η ιεραρχική συσταδοποίηση και συσταδοποίηση που βασίζεται στην πυκνότητα. Στην συνέχεια γίνεται αναφορά σε συγκεκριμένους αλγορίθμους συσταδοποίησης όπως ο αλγόριθμος των Κ-Μέσων (και η παραλλαγή του διχοτομικού αλγορίθμου των Κ-Μέσων), ο συσσωρευτικός ιεραρχικός αλγόριθμος και ο αλγόριθμος DBSCAN. Επίσης παρουσιάζονται διαφορετικές τεχνικές εφαρμογής της ιεραρχικής συσταδοποίησης, όπως είναι η τεχνική του απλού συνδέσμου ( ή της ελάχιστης απόστασης), η τεχνική του πλήρους συνδέσμου (ή της μέγιστης απόστασης), η τεχνική του μέσου όρου ομάδας και η μέθοδος Ward.
|