Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα
Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2023
|
Θέματα: | |
Διαθέσιμο Online: | https://hdl.handle.net/10889/24374 |
id |
nemertes-10889-24374 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-243742023-02-03T04:37:10Z Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα Principal component analysis and clustering : application in agricultural data Παπακωνσταντίνου, Μαρία Papakonstantinou, Maria Ανάλυση σε κύριες συνιστώσες Συσταδοποίηση Δενδροδιάγραμμα Ανάλυση δεδομένων Principal Components Analysis Clustering Dendrogram Data analysis Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο δεδομένων από διάφορες ποικιλίες μελιτζανών. Έναυσμα για την ανάπτυξη των μεθόδων αυτών αποτέλεσε η εκτεταμένη χρήση της τεχνολογίας μέσω των ηλεκτρονικών υπολογιστών με αποτέλεσμα, την αποθήκευση μεγάλου όγκου πληροφορίας στις συσκευές αυτές. Έτσι, εμφανίστηκε η ανάγκη δημιουργίας τεχνικών μείωσης της υπό ανάλυση πληροφορίας με σκοπό την καλύτερη μελέτη των δεδομένων από τον ερευνητή αλλά και για την εξοικονόμηση πόρων στους ηλεκτρονικούς υπολογιστές. Στο πρώτο κεφάλαιο της εργασίας, παρουσιάζεται η τεχνική της ανάλυσης σε κύριες συνιστώσες ως προς τη μαθηματική θεμελίωση της τεχνικής αυτής αλλά και από την σκοπιά της στατιστικής. Αναλύεται η ιδέα που κρύβεται πίσω από τους μαθηματικούς υπολογισμούς αλλά και ο τρόπος με τον οποίο δημιουργούνται νέοι γραμμικοί συνδυασμοί οι οποίοι με την βοήθεια των ιδιοτιμών και των ιδιοδιανυσμάτων επιτυγχάνουν να εξηγούν την μεταβλητότητα των αρχικών δεδομένων. Στο δεύτερο κεφάλαιο της εργασίας, παρατίθεται το θεωρητικό υπόβαθρο για την τεχνική της συσταδοποίησης κάνοντας αναφορά στις δυο βασικότερες κατηγορίες αυτής της μεθόδου δηλαδή στις ιεραρχικές και στις μη ιεραρχικές όπου στη πορεία διακρίνουμε και τις υποκατηγορίες αυτών. Ακόμη, γίνεται λόγος για τις βασικότερες μεθόδους που χρησιμοποιούμε για την ομαδοποίηση καθώς και τον τρόπο με τον οποίο αυτές λειτουργούν. Στο τρίτο και τελευταίο κεφάλαιο, ακολουθούν οι αναλύσεις πάνω στο σύνολο δεδομένων που έχει επιλεγεί εφαρμόζοντας ξεχωριστά την ανάλυση σε κύριες συνιστώσες και την ομαδοποίηση με σκοπό την εξαγωγή συμπερασμάτων βάση αυτών. In this thesis, we study two basic techniques for reducing data volume. In particular, we discuss principal component analysis and clustering both in terms of their theoretical framework and in terms of the application of these methods on a specific dataset of different eggplant varieties. The development of these methods was triggered by the extensive use of technology through computers, resulting in the storage of large amounts of information on these devices. Thus, appeared the need to develop techniques for reducing the amount of information to be analysed in order to allow the researcher to better study the data and to save space on the computers. In the first chapter, the principal components analysis technique is presented in terms of mathematical foundation and from the point of view of statistics. The idea behind the mathematical calculations is analysed and the way in which new linear combinations are created, with the help of eigenvalues and eigenvectors, which succeed in explaining the variability of the original data. In the second chapter , the theoretical background for the clustering technique is presented by referring to the two main categories of this method, namely hierarchical and non hierarchical, where in the process we distinguish the subcategories of these. Furthermore, we discuss the most basic methods we use for clustering and how they work. In the third and final chapter, the analyses on the selected dataset are carried out by separately applying principal component analysis and clustering in order to draw conclusions based on them. 2023-02-02T14:14:26Z 2023-02-02T14:14:26Z 2023-01-18 https://hdl.handle.net/10889/24374 el application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Ανάλυση σε κύριες συνιστώσες Συσταδοποίηση Δενδροδιάγραμμα Ανάλυση δεδομένων Principal Components Analysis Clustering Dendrogram Data analysis |
spellingShingle |
Ανάλυση σε κύριες συνιστώσες Συσταδοποίηση Δενδροδιάγραμμα Ανάλυση δεδομένων Principal Components Analysis Clustering Dendrogram Data analysis Παπακωνσταντίνου, Μαρία Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
description |
Στην παρούσα διπλωματική εργασία μελετάμε δύο βασικές τεχνικές μείωσης του όγκου των δεδομένων. Ειδικότερα, γίνεται λόγος για την ανάλυση σε κύριες συνιστώσες και την συσταδοποίηση τόσο ως προς το θεωρητικό τους πλαίσιο αλλά και ως προς την εφαρμογή των μεθόδων αυτών πάνω σε ένα συγκεκριμένο σύνολο δεδομένων από διάφορες ποικιλίες μελιτζανών. Έναυσμα για την ανάπτυξη των μεθόδων αυτών αποτέλεσε η εκτεταμένη χρήση της τεχνολογίας μέσω των ηλεκτρονικών υπολογιστών με αποτέλεσμα, την αποθήκευση μεγάλου όγκου πληροφορίας στις συσκευές αυτές. Έτσι, εμφανίστηκε η ανάγκη δημιουργίας τεχνικών μείωσης της υπό ανάλυση πληροφορίας με σκοπό την καλύτερη μελέτη των δεδομένων από τον ερευνητή αλλά και για την εξοικονόμηση πόρων στους ηλεκτρονικούς υπολογιστές.
Στο πρώτο κεφάλαιο της εργασίας, παρουσιάζεται η τεχνική της ανάλυσης σε κύριες συνιστώσες ως προς τη μαθηματική θεμελίωση της τεχνικής αυτής αλλά και από την σκοπιά της στατιστικής. Αναλύεται η ιδέα που κρύβεται πίσω από τους μαθηματικούς υπολογισμούς αλλά και ο τρόπος με τον οποίο δημιουργούνται νέοι γραμμικοί συνδυασμοί οι οποίοι με την βοήθεια των ιδιοτιμών και των ιδιοδιανυσμάτων επιτυγχάνουν να εξηγούν την μεταβλητότητα των αρχικών δεδομένων.
Στο δεύτερο κεφάλαιο της εργασίας, παρατίθεται το θεωρητικό υπόβαθρο για την τεχνική της συσταδοποίησης κάνοντας αναφορά στις δυο βασικότερες κατηγορίες αυτής της μεθόδου δηλαδή στις ιεραρχικές και στις μη ιεραρχικές όπου στη πορεία διακρίνουμε και τις υποκατηγορίες αυτών. Ακόμη, γίνεται λόγος για τις βασικότερες μεθόδους που
χρησιμοποιούμε για την ομαδοποίηση καθώς και τον τρόπο με τον οποίο αυτές λειτουργούν.
Στο τρίτο και τελευταίο κεφάλαιο, ακολουθούν οι αναλύσεις πάνω στο σύνολο δεδομένων που έχει επιλεγεί εφαρμόζοντας ξεχωριστά την ανάλυση σε κύριες συνιστώσες και την ομαδοποίηση με σκοπό την εξαγωγή συμπερασμάτων βάση αυτών. |
author2 |
Papakonstantinou, Maria |
author_facet |
Papakonstantinou, Maria Παπακωνσταντίνου, Μαρία |
author |
Παπακωνσταντίνου, Μαρία |
author_sort |
Παπακωνσταντίνου, Μαρία |
title |
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
title_short |
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
title_full |
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
title_fullStr |
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
title_full_unstemmed |
Ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
title_sort |
ανάλυση σε κύριες συνιστώσες και συσταδοποίηση : εφαρμογή σε γεωπονικά δεδομένα |
publishDate |
2023 |
url |
https://hdl.handle.net/10889/24374 |
work_keys_str_mv |
AT papakōnstantinoumaria analysēsekyriessynistōseskaisystadopoiēsēepharmogēsegeōponikadedomena AT papakōnstantinoumaria principalcomponentanalysisandclusteringapplicationinagriculturaldata |
_version_ |
1771297268483227648 |