Στοχαστικά μοντέλα για την ανάλυση δεδομένων στο διαδίκτυο

Σκοπός της παρούσας διατριβής ήταν η μελέτη των χαρακτηριστικών της κίνησης στο διαδίκτυο και η ανάπτυξη κατάλληλων μοντέλων και τεχνικών για την αντιμετώπιση θεμάτων σχετικών με πρόβλεψη του φορτίου της κίνησης, τη δυναμική διάθεση εύρους ζώνης βασισμένη σε προβλέψεις και τη δημιουργία συνθετικής κ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κάτρης, Χρήστος
Άλλοι συγγραφείς: Δασκαλάκη, Σοφία
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2018
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/10998
Περιγραφή
Περίληψη:Σκοπός της παρούσας διατριβής ήταν η μελέτη των χαρακτηριστικών της κίνησης στο διαδίκτυο και η ανάπτυξη κατάλληλων μοντέλων και τεχνικών για την αντιμετώπιση θεμάτων σχετικών με πρόβλεψη του φορτίου της κίνησης, τη δυναμική διάθεση εύρους ζώνης βασισμένη σε προβλέψεις και τη δημιουργία συνθετικής κίνησης που προσομοιάζει με πραγματική κίνηση βίντεο. Επιπλέον, μελετήθηκε η σύνδεση των δικτύων και της τοπολογίας τους με χρονοσειρές έτσι ώστε οι ιδιότητες των χρονοσειρών που προκύπτουν να μπορούν να χρησιμοποιηθούν για την κατηγοριοποίηση των δικτύων, μια διεργασία ιδιαίτερα σημαντική αφού τα δίκτυα είναι λιγότερο ή περισσότερο ανθεκτικά σε κακόβουλες επιθέσεις ανάλογα με τον τύπο τους. Η κίνηση στο διαδίκτυο όπως γνωρίζουμε δημιουργείται από τα διαφορετικά είδη πολυμέσων που είναι συνδεδεμένα σε αυτό και αφορά δεδομένα audio, video, εικόνες, Ethernet, LANs, WANs, κλπ. Για όλα αυτά τα διαφορετικά είδη κίνησης η μοντελοποίηση τους είναι απαραίτητη για την επίλυση των διαφορετικών προβλημάτων τους. Έτσι τα θέματα τα οποία πραγματεύεται η διατριβή παρουσιάζουν ενδιαφέρον τόσο από πλευράς στοχαστικής μοντελοποίησης όσο και από πλευράς τηλεπικοινωνιακής μηχανικής όπου η μοντελοποίηση της κίνησης είναι απαραίτητη για άλλες εργασίες όπως η διάθεση εύρους ζώνης και η δημιουργία συνθετικής κίνησης. Στο πρώτο κεφάλαιο της διατριβής παρουσιάζεται μια γενική επισκόπηση σχετικά με το διαδίκτυο που αφορά αφ' ενός την ιστορική αναδρομή της δημιουργίας του αφ' ετέρου την οργάνωσή του, τις μέχρι τώρα προσεγγίσεις μοντελοποίησής του, την κίνηση και την τοπολογία του. Στο δεύτερο κεφάλαιο μελετώνται τα βασικά χαρακτηριστικά του διαδικτύου, τόσο αναφορικά με τις κατανομές που παρουσιάζουν οι διάφορες μετρικές (στατικά χαρακτηριστικά) όσο και με τη δυναμική του στο χρόνο. Από πλευράς μοντέλων παρουσιάζονται εκείνα τα πρότυπα χρονοσειρών με τα οποία μπορεί να μοντελοποιηθεί η κίνηση στο διαδίκτυο και αποτελούν τη βάση των μεθοδολογιών που αναπτύσσονται αργότερα στα κεφάλαια 3, 4 και 5. Τέλος, παρουσιάζονται βασικές έννοιες και στοιχεία της επιστήμης δικτύων που είναι απαραίτητα τόσο για την κατανόηση των χαρακτηριστικών της τοπολογίας του διαδικτύου όσο και για την ανάπτυξη της μεθοδολογίας που προτείνεται στο κεφάλαιο 6 και αφορά τη κατηγοριοποίηση δικτύων σε ελεύθερης ή μη-ελεύθερης κλίμακας. Το πρώτο αντικείμενο μελέτης της διατριβής παρουσιάζεται στο κεφάλαιο 3 και είναι η πρόβλεψη της κίνησης στο διαδίκτυο. Η όσο το δυνατόν ακριβέστερη πρόβλεψή της είναι απαραίτητη για επίλυση θεμάτων όπως είναι η κατανομή πόρων ενός συστήματος και ο σχεδιασμός δικτύων. Έχοντας σαν βάση μοντέλα όπως το FARIMA, το GARCH και τα τεχνητά νευρωνικά δίκτυα, προτείνονται προβλεπτικά σχήματα μέσω των συνδυασμών τους, επίσης ένα σχήμα επιλογής μοντέλου που βασίζεται σε έλεγχο μη-γραμμικότητας καθώς και υβριδικά μοντέλα που συνδυάζουν κατασκευαστικά τα επιμέρους μοντέλα. Σχεδιάστηκε επίσης ένα σχήμα σύγκρισης των διαφορετικών μεθοδολογιών αναφορικά με την πρόβλεψη ώστε να προκύψει η καταλληλότερη. Στο κεφάλαιο 4 οι προβλεπτικές προσεγγίσεις που αναπτύχθηκαν προηγουμένως χρησιμοποιούνται για τη δυναμική διάθεση εύρους ζώνης σε ένα end-to-end δίκτυο, ένα πολύ σημαντικό πρόβλημα που εντάσσεται στη γενικότερη διαχείριση πόρων του δικτύου. Η διάθεση εύρους ζώνης γενικά μπορεί να υλοποιηθεί είτε στατικά, κάτι το οποίο δε λαμβάνει υπόψη διακυμάνσεις στη ζήτηση, είτε δυναμικά, οπότε η πρόβλεψη παίζει ουσιατικό ρόλο. Για τις ανάγκες αυτού του κεφαλαίου ορίστηκε μία διαδικασία επιλογής του κατάλληλου μοντέλου πρόβλεψης που να έχει την ικανότητα να είναι ακριβές στην πρόβλεψη, αλλά ταυτόχρονα να μπορεί να εφαρμοστεί με επιτυχία σε σχήματα διάθεσης εύρους ζώνης. Τα υποψήφια μοντέλα ήταν τα FARIMA και τα FARIMA/GARCH, τα υβριδικά μοντέλα FARIMA-MLP και FARIMA/GARCH-MLP καθώς και δύο στρατηγικές πρόβλεψης όπου η μία επιλέγει μοντέλο ανάλογα με το αποτέλεσμα του ελέγχου για μη-γραμμικότητα στη δομή εξάρτησης των δεδομένων και η άλλη συνδυάζει προβλέψεις από διαφορετικές μεθοδολογίες. Για τη διάθεση εύρους ζώνης προτείνονται τρία διαφορετικά δυναμικά σχήματα τα οποία και αξιολογούνται με τη βοήθεια μετρικών. Από τη σύγκρισή τους εντοπίζεται η καλύτερη μεθοδολογία πρόβλεψης και καταγράφονται σημαντικά συμπεράσματα σχετικά με τα προτεινόμενα σχήματα διάθεσης εύρους ζώνης. Το τρίτο αντικείμενο μελέτης βρίσκεται στο κεφάλαιο 5 και είναι η δημιουργία συνθετικής κίνησης μέσω μοντέλων χρονοσειρών. Η δυνατότητα προσομοίωσης της κίνησης στο διαδίκτυο μπορεί να συμβάλλει στην αποτελεσματικότερη διαχείριση των δικτύων και την ανάλυση απόδοσής τους. Λόγω του ότι η ανάλυση της απόδοσης δικτύων με πραγματική κίνηση μπορεί να έχει μεγάλο κόστος και οι μετρήσεις να είναι δύσκολες, τα μαθηματικά μοντέλα που μπορούν να χρησιμοποιηθούν για να δημιουργήσουν κίνηση είναι πολύ σημαντικά. Σε αυτό το πλαίσιο θεωρούνται μοντέλα χρονοσειρών FARIMA και FARIMA/GARCH προκειμένου να επιτύχουμε συνθετική κίνηση με χαρακτηριστικά παρόμοια με εκείνα της πραγματικής. Όμως λόγω του ότι η αποτελεσματικότητά τους αποδείχτηκε περιορισμένη, στο κεφάλαιο αυτό προτείνουμε μια διαδικασία η οποία συνδυάζει το FARIMA μοντέλο με τη λογαριθμοκανονική κατανομή και παράγει συνθετική κίνηση που προσεγγίζει με ικανοποιητική ακρίβεια τη συμπεριφορά της πραγματικής. Τέλος, στο κεφάλαιο 6 επιχειρείται η επίλυση του προβλήματος της κατηγοριοποίησης ενός δικτύου σε ελεύθερης κλίμακας ή μη ελεύθερης κλίμακας. Τα δίκτυα στη σημερινή εποχή αποτελούν πολύπλοκες δομές και παριστάνονται γραφικά με κόμβους, που αποτελούν τις οντότητες ενδιαφέροντος, και ακμές, που αποτελούν τις σχέσεις μεταξύ τους. Το διαδίκτυο αλλά και κάθε μικρότερο ιδιωτικό υποδίκτυο που το πλαισιώνει, είναι τέτοιο δίκτυο με κόμβους τους εξυπηρετητές και ακμές (σχέσεις) τις συνδέσεις τους. Η ανθεκτικότητα ενός δικτύου σε διαφόρων ειδών επιθέσεις όπως αποδεικνύεται, εξαρτάται και από τον τύπο του. Συγκεκριμένα, τα ελεύθερης κλίμακας δίκτυα δείχνουν να είναι ανθεκτικά στις τυχαίες επιθέσεις αλλά πολύ ευάλωτα σε στοχευμένες επιθέσεις. Έτσι μια αξιόπιστη διαδικασία κατηγοριοποίησης των δικτύων θα ήταν πολύ σημαντικό εργαλείο για τους διαχειριστές τους. Στην παρούσα διατριβή προτείνεται ο μετασχηματισμός κάθε πολύπλοκου δικτύου σε χρονοσειρά. Για το μετασχηματισμό αυτό υπολογίζονται 3 συγκεκριμένες μετρικές των κόμβων που στη συνέχεια συμβάλλουν στον ορισμό μιας τελικής τιμής για κάθε κόμβο. Λαμβάνοντας υπόψη τις συνδέσεις μεταξύ των κόμβων, στη συνέχεια δημιουργείται μια ακολουθία δεδομένων που της συμπεριφερόμαστε ως χρονοσειρά. Με τη βοήθεια παραμέτρων όπως η παράμετρος Hurst και ο μέγιστος εκθέτης Lyapunov για χρονοσειρές είναι δυνατόν να χαρακτηριστεί το δίκτυο από το οποίο προέρχεται. Ο μετασχηματισμός εφαρμόζεται τόσο σε προσομοιωμένα όσο και σε πραγματικά δίκτυα όπου προσομοιώνονται τυχαίες και στοχευμένες επιθέσεις με σκοπό την αξιολόγηση του χαρακτηρισμού. Συνοπτικά, στη διατριβή αυτή προτείνονται μέθοδοι επίλυσης προβλημάτων που αφορούν την κίνηση του διαδικτύου και οι οποίες έχουν τη βάση τους σε μοντέλα χρονοσειρών. Τα αποτελέσματα των πειραμάτων που παρουσιάζονται στη διατριβή οδηγούν στο συμπέρασμα ότι για την επίλυση αυτών των συγκεκριμένων προβλημάτων, κάποιες από τις προτεινόμενες μεθόδους είναι ιδιαίτερα αποτελεσματικές και άλλες είναι καλύτερες από τις εναλλακτικές τους.