Πρόβλεψη κοινοτήτων σε γραφήματα κοινωνικών δικτύων χρήσει τεχνικών συνδυαστικής μηχανικής μάθησης και βάσει του αλγόριθμου Blondel

Η οργάνωση των κόμβων σε σύνολα από συστάδες, είναι ένα από τα πιο πολύτιμα χαρακτηριστικά μελέτης της ανάλυσης γραφημάτων και της κατανόησης πολυσύνθετων συστημάτων, εμφανίζοντας χρησιμότητα σε ένα ευρύ φάσμα ερευνητικών πεδίων. Με την εκρηκτική αύξηση της χρήση τον μέσων κοινωνικής δικτύωσης, η αν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ρίζος, Ιωάννης Ορέστης
Άλλοι συγγραφείς: Μακρής, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2020
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/13170
Περιγραφή
Περίληψη:Η οργάνωση των κόμβων σε σύνολα από συστάδες, είναι ένα από τα πιο πολύτιμα χαρακτηριστικά μελέτης της ανάλυσης γραφημάτων και της κατανόησης πολυσύνθετων συστημάτων, εμφανίζοντας χρησιμότητα σε ένα ευρύ φάσμα ερευνητικών πεδίων. Με την εκρηκτική αύξηση της χρήση τον μέσων κοινωνικής δικτύωσης, η ανίχνευση της κοινοτικής δομής και η λύση του προβλήματος αυτού με αποδοτικό τρόπο ποτέ δεν ήταν πιο επίκαιρη αλλά ταυτόχρονα και πιο απαιτητική, εξαιτίας του τεράστιου μεγέθους των δικτύων αυτών. Η χρήση κλασσικών μεθόδων και αλγορίθμων ανίχνευσης κοινοτήτων καταλήγει πολύ συχνά να είναι ανέφικτη λόγω της έλλειψης κλιμάκωσης που αυτοί παρουσιάζουν. Σύγχρονα βήματα στον τομέα των τεχνικών πρόβλεψης συνδέσεων, προσεγγίζουν το πρόβλημα εξαγωγής κοινοτικής δομής, αξιοποιώντας εργαλεία κατανεμημένης μηχανικής μάθησης. Τα αποτελέσματα των ερευνών αυτών, έχουν δείξει πως η εξαγωγή της κοινοτικής πληροφορίας με χρήση τεχνικών πρόβλεψης συνδέσεων είναι μια εφαρμόσιμη εναλλακτική μέθοδος προσέγγισής αυτού του NP-hard προβλήματος, εμφανίζοντας ικανοποιητική ακρίβεια ταξινόμησης, διατηρώντας παράλληλα την αποδοτικότητα των κατανεμημένων μοντέλων. Ένα ακόμα πεδίο με αυξανόμενο ερευνητικό ενδιαφέρον είναι η χρήση τεχνικών συνδυαστικής μάθησης αποσκοπώντας την αύξηση της απόδοσης μοντέλων επιβλεπομένης μάθησης. Ο βασικός στόχος της παρούσας διπλωματικής είναι να προταθεί μια βελτιστοποιημένη μεθοδολογία ανίχνευσης κοινοτήτων, χρησιμοποιώντας την υπάρχουσα ως βάση, και εξελίσσοντας την, εισάγοντας τις τεχνικές συνδυαστικής μηχανικής μάθησης. Το κύριο σημείο συμφόρησης που επιχειρείται να ξεπεραστεί είναι αυτό της υπερβολικής τοπολογικής ανομοιογένειας που παρουσιάζουν τα πολύ μεγάλα κοινωνικά δίκτυα, και που ένα μονάχα μικρό αντιπροσωπευτικό υπογράφημα ως σύνολο εκπαίδευσης δεν μπορεί να συλλάβει. Προτείνουμε λοιπόν πως η χρήση ensemble μοντέλων μάθησης, σε συνδυασμό με την αντικατάσταση του “αντιπροσωπευτικού” υπογραφήματος με μια καλύτερη εναλλακτική υπό την μορφή πολλαπλών τυχαίων υπογραφημάτων, θα επιφέρουν μεγαλύτερη ακρίβεια στην κοινοτική δομή που εξάγεται.