Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα

Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Παπακωνσταντίνου, Μαρία
Άλλοι συγγραφείς: Papakonstantinou, Maria
Γλώσσα:Greek
Έκδοση: 2023
Θέματα:
Διαθέσιμο Online:https://hdl.handle.net/10889/24374
id nemertes-10889-24374
record_format dspace
spelling nemertes-10889-243742023-02-03T04:37:10Z Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα Principal component analysis and clustering : application in agricultural data Παπακωνσταντίνου, Μαρία Papakonstantinou, Maria Ανάλυση σε κύριες συνιστώσες Συσταδοποίηση Δενδροδιάγραμμα Ανάλυση δεδομένων Principal Components Analysis Clustering Dendrogram Data analysis Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο δεδομένων από διάφορες ποικιλίες μελιτζανών. Έναυσμα για την ανάπτυξη των μεθόδων αυτών αποτέλεσε η εκτεταμένη χρήση της τεχνολογίας μέσω των ηλεκτρονικών υπολογιστών με αποτέλεσμα, την αποθήκευση μεγάλου όγκου πληροφορίας στις συσκευές αυτές. Έτσι, εμφανίστηκε η ανάγκη δημιουργίας τεχνικών μείωσης της υπό ανάλυση πληροφορίας με σκοπό την καλύτερη μελέτη των δεδομένων από τον ερευνητή αλλά και για την εξοικονόμηση πόρων στους ηλεκτρονικούς υπολογιστές. Στο πρώτο κεφάλαιο της εργασίας, παρουσιάζεται η τεχνική της ανάλυσης σε κύριες συνιστώσες ως προς τη μαθηματική θεμελίωση της τεχνικής αυτής αλλά και από την σκοπιά της στατιστικής. Αναλύεται η ιδέα που κρύβεται πίσω από τους μαθηματικούς υπολογισμούς αλλά και ο τρόπος με τον οποίο δημιουργούνται νέοι γραμμικοί συνδυασμοί οι οποίοι με την βοήθεια των ιδιοτιμών και των ιδιοδιανυσμάτων επιτυγχάνουν να εξηγούν την μεταβλητότητα των αρχικών δεδομένων. Στο δεύτερο κεφάλαιο της εργασίας, παρατίθεται το θεωρητικό υπόβαθρο για την τεχνική της συσταδοποίησης κάνοντας αναφορά στις δυο βασικότερες κατηγορίες αυτής της μεθόδου δηλαδή στις ιεραρχικές και στις μη ιεραρχικές όπου στη πορεία διακρίνουμε και τις υποκατηγορίες αυτών. Ακόμη, γίνεται λόγος για τις βασικότερες μεθόδους που χρησιμοποιούμε για την ομαδοποίηση καθώς και τον τρόπο με τον οποίο αυτές λειτουργούν. Στο τρίτο και τελευταίο κεφάλαιο, ακολουθούν οι αναλύσεις πάνω στο σύνολο δεδομένων που έχει επιλεγεί εφαρμόζοντας ξεχωριστά την ανάλυση σε κύριες συνιστώσες και την ομαδοποίηση με σκοπό την εξαγωγή συμπερασμάτων βάση αυτών. In this thesis, we study two basic techniques for reducing data volume. In particular, we discuss principal component analysis and clustering both in terms of their theoretical framework and in terms of the application of these methods on a specific dataset of different eggplant varieties. The development of these methods was triggered by the extensive use of technology through computers, resulting in the storage of large amounts of information on these devices. Thus, appeared the need to develop techniques for reducing the amount of information to be analysed in order to allow the researcher to better study the data and to save space on the computers. In the first chapter, the principal components analysis technique is presented in terms of mathematical foundation and from the point of view of statistics. The idea behind the mathematical calculations is analysed and the way in which new linear combinations are created, with the help of eigenvalues and eigenvectors, which succeed in explaining the variability of the original data. In the second chapter , the theoretical background for the clustering technique is presented by referring to the two main categories of this method, namely hierarchical and non hierarchical, where in the process we distinguish the subcategories of these. Furthermore, we discuss the most basic methods we use for clustering and how they work. In the third and final chapter, the analyses on the selected dataset are carried out by separately applying principal component analysis and clustering in order to draw conclusions based on them. 2023-02-02T14:14:26Z 2023-02-02T14:14:26Z 2023-01-18 https://hdl.handle.net/10889/24374 el application/pdf
institution UPatras
collection Nemertes
language Greek
topic Ανάλυση σε κύριες συνιστώσες
Συσταδοποίηση
Δενδροδιάγραμμα
Ανάλυση δεδομένων
Principal Components Analysis
Clustering
Dendrogram
Data analysis
spellingShingle Ανάλυση σε κύριες συνιστώσες
Συσταδοποίηση
Δενδροδιάγραμμα
Ανάλυση δεδομένων
Principal Components Analysis
Clustering
Dendrogram
Data analysis
Παπακωνσταντίνου, Μαρία
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
description Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο δεδομένων από διάφορες ποικιλίες μελιτζανών. Έναυσμα για την ανάπτυξη των μεθόδων αυτών αποτέλεσε η εκτεταμένη χρήση της τεχνολογίας μέσω των ηλεκτρονικών υπολογιστών με αποτέλεσμα, την αποθήκευση μεγάλου όγκου πληροφορίας στις συσκευές αυτές. Έτσι, εμφανίστηκε η ανάγκη δημιουργίας τεχνικών μείωσης της υπό ανάλυση πληροφορίας με σκοπό την καλύτερη μελέτη των δεδομένων από τον ερευνητή αλλά και για την εξοικονόμηση πόρων στους ηλεκτρονικούς υπολογιστές. Στο πρώτο κεφάλαιο της εργασίας, παρουσιάζεται η τεχνική της ανάλυσης σε κύριες συνιστώσες ως προς τη μαθηματική θεμελίωση της τεχνικής αυτής αλλά και από την σκοπιά της στατιστικής. Αναλύεται η ιδέα που κρύβεται πίσω από τους μαθηματικούς υπολογισμούς αλλά και ο τρόπος με τον οποίο δημιουργούνται νέοι γραμμικοί συνδυασμοί οι οποίοι με την βοήθεια των ιδιοτιμών και των ιδιοδιανυσμάτων επιτυγχάνουν να εξηγούν την μεταβλητότητα των αρχικών δεδομένων. Στο δεύτερο κεφάλαιο της εργασίας, παρατίθεται το θεωρητικό υπόβαθρο για την τεχνική της συσταδοποίησης κάνοντας αναφορά στις δυο βασικότερες κατηγορίες αυτής της μεθόδου δηλαδή στις ιεραρχικές και στις μη ιεραρχικές όπου στη πορεία διακρίνουμε και τις υποκατηγορίες αυτών. Ακόμη, γίνεται λόγος για τις βασικότερες μεθόδους που χρησιμοποιούμε για την ομαδοποίηση καθώς και τον τρόπο με τον οποίο αυτές λειτουργούν. Στο τρίτο και τελευταίο κεφάλαιο, ακολουθούν οι αναλύσεις πάνω στο σύνολο δεδομένων που έχει επιλεγεί εφαρμόζοντας ξεχωριστά την ανάλυση σε κύριες συνιστώσες και την ομαδοποίηση με σκοπό την εξαγωγή συμπερασμάτων βάση αυτών.
author2 Papakonstantinou, Maria
author_facet Papakonstantinou, Maria
Παπακωνσταντίνου, Μαρία
author Παπακωνσταντίνου, Μαρία
author_sort Παπακωνσταντίνου, Μαρία
title Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
title_short Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
title_full Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
title_fullStr Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
title_full_unstemmed Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
title_sort ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
publishDate 2023
url https://hdl.handle.net/10889/24374
work_keys_str_mv AT papakōnstantinoumaria analysēsekyriessynistōseskaisystadopoiēsēepharmogēsegeōponikadedomena
AT papakōnstantinoumaria principalcomponentanalysisandclusteringapplicationinagriculturaldata
_version_ 1771297268483227648