Περίληψη: | Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο δεδομένων από διάφορες ποικιλίες μελιτζανών. Έναυσμα για την ανάπτυξη των μεθόδων αυτών αποτέλεσε η εκτεταμένη χρήση της τεχνολογίας μέσω των ηλεκτρονικών υπολογιστών με αποτέλεσμα, την αποθήκευση μεγάλου όγκου πληροφορίας στις συσκευές αυτές. Έτσι, εμφανίστηκε η ανάγκη δημιουργίας τεχνικών μείωσης της υπό ανάλυση πληροφορίας με σκοπό την καλύτερη μελέτη των δεδομένων από τον ερευνητή αλλά και για την εξοικονόμηση πόρων στους ηλεκτρονικούς υπολογιστές.
Στο πρώτο κεφάλαιο της εργασίας, παρουσιάζεται η τεχνική της ανάλυσης σε κύριες συνιστώσες ως προς τη μαθηματική θεμελίωση της τεχνικής αυτής αλλά και από την σκοπιά της στατιστικής. Αναλύεται η ιδέα που κρύβεται πίσω από τους μαθηματικούς υπολογισμούς αλλά και ο τρόπος με τον οποίο δημιουργούνται νέοι γραμμικοί συνδυασμοί οι οποίοι με την βοήθεια των ιδιοτιμών και των ιδιοδιανυσμάτων επιτυγχάνουν να εξηγούν την μεταβλητότητα των αρχικών δεδομένων.
Στο δεύτερο κεφάλαιο της εργασίας, παρατίθεται το θεωρητικό υπόβαθρο για την τεχνική της συσταδοποίησης κάνοντας αναφορά στις δυο βασικότερες κατηγορίες αυτής της μεθόδου δηλαδή στις ιεραρχικές και στις μη ιεραρχικές όπου στη πορεία διακρίνουμε και τις υποκατηγορίες αυτών. Ακόμη, γίνεται λόγος για τις βασικότερες μεθόδους που
χρησιμοποιούμε για την ομαδοποίηση καθώς και τον τρόπο με τον οποίο αυτές λειτουργούν.
Στο τρίτο και τελευταίο κεφάλαιο, ακολουθούν οι αναλύσεις πάνω στο σύνολο δεδομένων που έχει επιλεγεί εφαρμόζοντας ξεχωριστά την ανάλυση σε κύριες συνιστώσες και την ομαδοποίηση με σκοπό την εξαγωγή συμπερασμάτων βάση αυτών.
|