Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα
Τα περισσότερα δεδομένα που συλλέγονται σήμερα, είναι δεδομένα υψηλής διάστασης. Αυτό έχει σαν αποτέλεσμα, οι περισσότερες μελέτες που γίνονται, να αφορούν τέτοια δεδομένα, ενώ λόγω της πολύπλοκης φύσης τους, η ανάλυση αυτών είναι μια απαιτητική διαδικασία. Στόχος της παρούσας διπλωματικής είνα...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2020
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/13833 |
id |
nemertes-10889-13833 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-138332022-09-05T20:46:38Z Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα Andrews curves and a new method for identifying hot spots in high dimensional data Σκαμνιά, Αικατερίνη Skamnia, Ekaterini Καμπύλες Andrews Συσταδοποίηση Ασυνήθιστες παρατηρήσεις Περιοχές υπερσυγκέντρωσης παρατηρήσεων Andrews curves Clustering Unusual observations Hot spots Τα περισσότερα δεδομένα που συλλέγονται σήμερα, είναι δεδομένα υψηλής διάστασης. Αυτό έχει σαν αποτέλεσμα, οι περισσότερες μελέτες που γίνονται, να αφορούν τέτοια δεδομένα, ενώ λόγω της πολύπλοκης φύσης τους, η ανάλυση αυτών είναι μια απαιτητική διαδικασία. Στόχος της παρούσας διπλωματικής είναι να παρουσιάσει μια γραφική μέθοδο αναπαράστασης αυτών των δεδομένων, τις Καμπύλες Andrews. Είναι μια μέθοδος κατά την οποία παρουσιάζεται μια μείωση της διαστασιμότητας, με τα δεδομένα να αναπαρίστανται στις 2 διαστάσεις, ενώ είναι χρήσιμη για τον έλεγχο ύπαρξης ασυνήθιστων παρατηρήσεων, ή/και συστάδων. Επιπλέον, αναπτύσσεται μία νέα μέθοδος, κατάλληλη για την ανίχνευση περιοχών με αυξημένη συγκέντρωση παρατηρήσεων, οι οποίες είναι πολυδιάστατες. Η παρούσα εργασία αποτελείται από τέσσερα επιμέρους κεφάλαια. Στο Κεφάλαιο 1, γίνεται μία εισαγωγή των βασικών εννοιών, των οποίων η γνώση είναι απαραίτητη για την κατανόηση της συνέχειας της εργασίας. Στο Κεφάλαιο 2, παρουσιάζεται η μέθοδος των καμπυλών Andrews που είναι και το θέμα της εργασίας. Στη συνέχεια, στο Κεφάλαιο 3, αναπτύσσεται η προτεινόμενη μέθοδος για τον εντοπισμό των περιοχών με υπερσυγκέντρωση, ενώ ακολουθούν και κάποια παραδείγματα με προσομοιωμένα παραδείγματα στην R, για την κατανόηση της εφαρμογής. Τέλος, στο Κεφάλαιο 4, πραγματοποιείται η μελέτη των προσομοιώσεων που έγιναν, για τέσσερα δυνατά σενάρια, τα οποία θεωρήθηκαν στα πλαίσια της παρούσας διπλωματικής εργασίας. The majority of the data that exist and are collected from all types of studies these days, are high dimensional. The analysis of them, is a challenging task, especially because of complex relationships that may exist among variables. In the first place, the aim of this dissertation, is to inform about a graphical method, Andrews Curves in which we have a dimensionality reduction and our data are placed in a 2-dimensional space. Their properties make them especially useful, when someone is trying to identify possible clusters or/and outliers in a dataset. Furthermore, a new method is advanced, suitable for identifying hot spots, in high dimensional data. This thesis consists of four chapters. In Chapter 1, there is an introduction of some basic definitions, for the purpose of understanding better the rest of the Chapters. In Chapter 2, we introduce Andrews curves, which are one of the two main topics. The new method that was developed for the detection of hot spots, is included in Chapter 3, along with some toy examples with simulated data in R code. Finally, in Chapter 4 we study the results we have taken from 4 possible scenarios, we have considered, with simulated datasets generated with R. 2020-10-02T06:08:54Z 2020-10-02T06:08:54Z 2020-09 http://hdl.handle.net/10889/13833 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Καμπύλες Andrews Συσταδοποίηση Ασυνήθιστες παρατηρήσεις Περιοχές υπερσυγκέντρωσης παρατηρήσεων Andrews curves Clustering Unusual observations Hot spots |
spellingShingle |
Καμπύλες Andrews Συσταδοποίηση Ασυνήθιστες παρατηρήσεις Περιοχές υπερσυγκέντρωσης παρατηρήσεων Andrews curves Clustering Unusual observations Hot spots Σκαμνιά, Αικατερίνη Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
description |
Τα περισσότερα δεδομένα που συλλέγονται σήμερα, είναι δεδομένα υψηλής διάστασης.
Αυτό έχει σαν αποτέλεσμα, οι περισσότερες μελέτες που γίνονται, να αφορούν τέτοια δεδομένα,
ενώ λόγω της πολύπλοκης φύσης τους, η ανάλυση αυτών είναι μια απαιτητική διαδικασία.
Στόχος της παρούσας διπλωματικής είναι να παρουσιάσει μια γραφική μέθοδο αναπαράστασης αυτών των δεδομένων, τις Καμπύλες Andrews.
Είναι μια μέθοδος κατά την οποία παρουσιάζεται μια μείωση της διαστασιμότητας, με τα δεδομένα να αναπαρίστανται στις 2 διαστάσεις, ενώ είναι χρήσιμη για τον έλεγχο ύπαρξης ασυνήθιστων παρατηρήσεων, ή/και συστάδων.
Επιπλέον, αναπτύσσεται μία νέα μέθοδος, κατάλληλη για την ανίχνευση περιοχών με αυξημένη συγκέντρωση παρατηρήσεων, οι οποίες είναι πολυδιάστατες.
Η παρούσα εργασία αποτελείται από τέσσερα επιμέρους κεφάλαια.
Στο Κεφάλαιο 1, γίνεται μία εισαγωγή των βασικών εννοιών, των οποίων η γνώση είναι απαραίτητη για την κατανόηση της συνέχειας της εργασίας.
Στο Κεφάλαιο 2, παρουσιάζεται η μέθοδος των καμπυλών Andrews που είναι και το θέμα της εργασίας.
Στη συνέχεια, στο Κεφάλαιο 3, αναπτύσσεται η προτεινόμενη μέθοδος για τον εντοπισμό των περιοχών με υπερσυγκέντρωση, ενώ ακολουθούν και κάποια παραδείγματα με προσομοιωμένα παραδείγματα στην R, για την κατανόηση της εφαρμογής.
Τέλος, στο Κεφάλαιο 4, πραγματοποιείται η μελέτη των προσομοιώσεων που έγιναν, για τέσσερα δυνατά σενάρια, τα οποία θεωρήθηκαν στα πλαίσια της παρούσας διπλωματικής εργασίας. |
author2 |
Skamnia, Ekaterini |
author_facet |
Skamnia, Ekaterini Σκαμνιά, Αικατερίνη |
author |
Σκαμνιά, Αικατερίνη |
author_sort |
Σκαμνιά, Αικατερίνη |
title |
Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
title_short |
Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
title_full |
Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
title_fullStr |
Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
title_full_unstemmed |
Καμπύλες Andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
title_sort |
καμπύλες andrews και ανάπτυξη μεθόδου για την ανίχνευση περιοχών με υπερσυγκέντρωση παρατηρήσεων (hot spot) σε πολυδιάστατα δεδομένα |
publishDate |
2020 |
url |
http://hdl.handle.net/10889/13833 |
work_keys_str_mv |
AT skamniaaikaterinē kampylesandrewskaianaptyxēmethodougiatēnanichneusēperiochōnmeypersynkentrōsēparatērēseōnhotspotsepolydiastatadedomena AT skamniaaikaterinē andrewscurvesandanewmethodforidentifyinghotspotsinhighdimensionaldata |
_version_ |
1771297307985182720 |