Κατανεμημένη υλοποίηση τεχνικών επισημείωσης αδόμητου κειμένου με οντότητες Wikipedia, με χρήση τεχνικών εντοπισμού κοινοτήτων με βάση την τεχνική K-μέσων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής

Η επισημείωση αδόμητου κειμένου με σχετική εννοιολογική πληροφορία αποτελεί σημαντικό βήμα προεπεξεργασίας σε πεδία σαν την ανάκτηση πληροφορίας, την τεχνητή νοημοσύνη, την μηχανική μάθηση, την διαχείριση δεδομένων κ.α. Οι οντότητες που υπάρχουν στην Wikipedia συνοδεύονται από κοινά αποδεκτές περιγρ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Κύρος, Στέργιος
Άλλοι συγγραφείς: Kyros, Stergios
Γλώσσα:Greek
Έκδοση: 2022
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/16439
Περιγραφή
Περίληψη:Η επισημείωση αδόμητου κειμένου με σχετική εννοιολογική πληροφορία αποτελεί σημαντικό βήμα προεπεξεργασίας σε πεδία σαν την ανάκτηση πληροφορίας, την τεχνητή νοημοσύνη, την μηχανική μάθηση, την διαχείριση δεδομένων κ.α. Οι οντότητες που υπάρχουν στην Wikipedia συνοδεύονται από κοινά αποδεκτές περιγραφές εννοιών. Η διαδικασία επισημείωσης κειμένου με την χρήση οντοτήτων της Wikipedia, διαδικασία γνωστή και ως Wikification είναι διαδικασία δύο βημάτων. Το πρώτο βήμα είναι η αναγνώριση των κυρίαρχων εννοιών του κειμένου (αναγνώριση επονομαζόμενων οντοτήτων) και στην συνέχεια η σύνδεση τους με άρθρο της Wikipedia αντίστοιχου εννοιολογικού πλαισίου (αποσαφήνιση επονομαζόμενων οντοτήτων). Τα σύγχρονα συστήματα σύνδεσης οντοτήτων δεν περιορίζουν την ανάλυση τους μόνο στα λεξιλογικά χαρακτηριστικά του κειμένου. Ένας από τους τρόπους για να αναπαρασταθούν πιο λεπτομερώς οι σχέσεις μεταξύ των οντοτήτων είναι με την μοντελοποίηση των σχέσεων μεταξύ των οντοτήτων και τον αναφορών σε γράφημα με την βοήθεια μεγάλων βάσεων γνώσης σαν την Wikipedia. Αυτό παρέχει την δυνατότητα να εξαχθούν σύνθετα χαρακτηριστικά εκμεταλλευόμενοι την σύνθετη σχέση που δημιουργείται ανάμεσα στις οντότητες, όπως και την τοπολογία του γραφήματος. Η παρούσα διπλωματική εργασία επικεντρώνεται στην επισημείωση αδόμητου κειμένου με την χρήση οντοτήτων Wikipedia, χρησιμοποιώντας τον αλγόριθμο K-μέσων για την εκμετάλλευση των σύνθετων σχέσεων του γραφήματος της Wikipedia με την εύρεση κοινοτήτων οντοτήτων και την εξαγωγή χρήσιμων χαρακτηριστικών, ώστε να γίνει χρήση Νευρωνικών Δικτύων βαθιάς αρχιτεκτονικής για την επίτευξη αξιόπιστων προβλέψεων. Η υλοποίηση που παρέχεται αποτελεί μια πλήρως κατανεμημένη και κλιμακώσιμη προσέγγιση, η οποία δείχνει την συμβολή της χρήσης της πληροφορίας των κοινοτήτων στην επιτυχή αντιστοίχιση αναφοράς σε οντότητα.