Περίληψη: | Η παρούσα διπλωματική εργασία βρίσκεται στον ευρύτερο χώρο της
μαθηματικής στατιστικής θεωρίας των γραφημάτων. Κύριος στόχος μας,
όπως αναφέρει και ο τίτλος, είναι η μοντελοποίηση γραφημάτων, με
απώτερο σκοπό την προσαρμογή, προσομοίωση και διάγνωση αυτών μέσω
μοντέλων εκθετικών τυχαίων γραφημάτων. Το πρώτο κεφάλαιο δίνει μια
συνοπτική παρουσίαση της διατύπωσης του προβλήματος και της θεωρίας
των μοντέλων των εκθετικών τυχαίων γραφημάτων. Η βασική ιδέα είναι να
θεωρήσουμε ως τυχαίες μεταβλητές τους δυνατούς δεσμούς μεταξύ των
κόμβων ενός δοθέντος γραφήματος. Η γενική μορφή ενός μοντέλου εκθετικά
τυχαίου γραφήματος καθορίζεται από κάποιες υποθέσεις σχετικές με τις
εξαρτήσεις μεταξύ αυτών των τυχαίων μεταβλητών. Παρουσιάζουμε κάποιες
διαφορετικές υποθέσεις εξάρτησης και τα αντίστοιχα μοντέλα, όπως τα
γραφημάτα Bernoulli, τα δυαδικώς - ανεξάρτητα και τα τυχαία γραφήματα
Markov. Επίσης, εξετάζουμε την ενσωμάτωση των χαρακτηριστικών, που
μπορούν να έχουν οι κόμβοι, σε μοντέλα κοινωνικής επιλογής, δηλαδή, σε
περιπτώσεις που οι συνδέσεις του γραφήματος μπορούν να προβλέψουν τα
χαρακτηριστικά των κόμβων. Συνοψίζουμε κάποιες καινούργιες υποθέσεις
εξάρτησης, που είναι πολυπλοκότερες των πρώτων τέτοιων υποθέσεων της
σχετικής βιβλιογραφίας. Συζητούμε τις διαδικασίες της στατιστικής
εκτίμησης, συμπεριλαμβανομένων των νέων μεθόδων για την εκτίμηση της
μέγιστης πιθανοφάνειας Monte Carlo. Τέλος, παρουσιάζουμε τις νέες
προδιαγραφές για μοντέλα εκθετικών τυχαίων γραφημάτων, που έχουν
προτείνει οι Snijders et al., οι οποίες βελτιώνουν σημαντικά τα
αποτελέσματα της προσαρμογής εμπειρικών δεδομένων για εκθετικά μοντέλα
ομοιογενών τυχαίων γραφημάτων Markov. Επιπλέον, οι νέες αυτές
προδιαγραφές μας βοηθούν να αποφύγουμε το πρόβλημα του
σχεδόν-εκφυλισμού, που συχνά παρεμβάλλεται στη διαδικασία της
προσαρμογής μοντέλων εκθετικών τυχαίων γραφημάτων Markov, ιδιαίτερα
όταν αυτά προέρχονται από εμπειρικά δεδομένα, που έχουν υψηλό βαθμό
μεταβατικότητας. Η μελέτη μιας τέτοιας νέας στατιστικής με υψηλότερης
τάξης μεταβατικότητα επιτρέπει την εκτίμηση των παραμέτρων των
μοντέλων των εκθετικών γραφημάτων σε πολλές (αλλά όχι όλες)
περιπτώσεις, στις οποίες διαφορετικά θα ήταν αδύνατο να εκτιμηθούν οι
παράμετροι των μοντέλων των ομοιογενών γραφημάτων Markov. Στο δεύτερο,
τρίτο και τέταρτο κεφάλαιο της εργασίας εφαρμόζουμε τις παραπάνω
μεθόδους, αντιστοίχως, για τρείς αναλύσεις εμπειρικών δεδομένων: το
δίκτυο Florentine, το δίκτυο Faux Magnolia High και τα δίκτυα IPRED
και SWPAT. Σε αυτά τα κεφάλαια, παρουσιάζουμε τις διαδικασίες της
προσαρμογής, προσομοίωσης και διάγνωσης με παράθεση των αντίστοιχων
εντολών, χρησιμοποιώντας τα πακέτα statnet - ermg και sna, τα οποία
δουλεύουν στο περιβάλλον του πακέτου ελεύθερου λογισμικού R. Τέλος,
στο παράρτημα της εργασίας δίνουμε μια σύντομη εισαγωγή στο περιβάλλον
R και σε κάποιες γενικές εντολές αυτού.
|