Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχν...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2021
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/14955 |
id |
nemertes-10889-14955 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Σημασιολογική διασύνδεση οντοτήτων Αποσαφήνιση των λέξεων Εύρεση κοινοτήτων Πρόβλεψη κοινοτήτων Νευρωνικά δίκτυα Βαθιά μάθηση Named entity disambiguation Entity linking Word sense disambiguation Community detection Community prediction Deep neural networks Deep learning Wikipedia |
spellingShingle |
Σημασιολογική διασύνδεση οντοτήτων Αποσαφήνιση των λέξεων Εύρεση κοινοτήτων Πρόβλεψη κοινοτήτων Νευρωνικά δίκτυα Βαθιά μάθηση Named entity disambiguation Entity linking Word sense disambiguation Community detection Community prediction Deep neural networks Deep learning Wikipedia Ανδρικόπουλος, Ανδρέας Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
description |
Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχνητής νοημοσύνης, της μηχανικής μάθησης κ.α.. Αποτελεί την ικανότητα αναγνώρισης της σωστής έννοιας των αναφορών μέσα σε ένα κείμενο με υπολογιστικό τρόπο. Η δυσκολία του προβλήματος έγκειται στο γεγονός ότι οι αναφορές αυτές πολλές φορές είναι αμφίσημες και πολύσημες ως προς τις οντότητες του κόσμου που αναπαριστούν. Μια εφαρμογή ονομαστικής αποσαφήνισης οντοτήτων είναι στο πρόβλημα του Wikification, το οποίο στοχεύει στην εύρεση των κυρίαρχων εννοιών μέσα σε ένα κείμενο και τη διασύνδεση αυτών με άρθρα της Wikipedia που έχουν αντίστοιχο εννοιολογικό περιεχόμενο με το εκάστοτε κείμενο.
Η παρούσα μεταπτυχιακή εργασία επικεντρώνεται στο πρόβλημα της σημασιολογικής διασύνδεσης οντοτήτων μέσα από τη χρήση τεχνικών πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής. Η Wikipedia μπορεί να αναπαρασταθεί μέσω ενός γραφήματος με βαθύ σημασιολογικό περιεχόμενο, με κόμβους τα άρθρα και ακμές τους υπερσυνδέσμους μεταξύ των συ σχετιζόμενων άρθρων. Αντιμετωπίζοντας τα άρθρα σαν οντότητες, εφαρμόζουμε τεχνικές πρόβλεψης κοινοτήτων και τις ομαδοποιούμε με βάση το εννοιολογικό τους περιεχόμενο, με σκοπό να εξάγουμε τα κατάλληλα χαρακτηριστικά εκείνα που θα εκπαιδεύσουν την αρχιτεκτονική νευρωνικού δικτύου που επιλέχθηκε. Μέσα από την υλοποίηση και την αξιολόγηση μιας εγγενώς κατανεμημένης και βαθμωτής λύσης αποδεικνύεται η θετική συμβολή του χαρακτηριστικού της συνοχής της κοινότητας στο πρόβλημα της αποσαφήνισης οντοτήτων προσφέροντας ανταγωνιστικά αποτελέσματα, με ακρίβεια της τάξης του 81%. |
author2 |
Andrikopoulos, Andreas |
author_facet |
Andrikopoulos, Andreas Ανδρικόπουλος, Ανδρέας |
author |
Ανδρικόπουλος, Ανδρέας |
author_sort |
Ανδρικόπουλος, Ανδρέας |
title |
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
title_short |
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
title_full |
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
title_fullStr |
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
title_full_unstemmed |
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
title_sort |
κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής |
publishDate |
2021 |
url |
http://hdl.handle.net/10889/14955 |
work_keys_str_mv |
AT andrikopoulosandreas katanemēmenēylopoiēsētechnikōnsēmasiologikēsdiasyndesēsmeontotēteswikipediametechnikesproblepsēskoinotētōnkaineurōnikōndiktyōnbathiasarchitektonikēs AT andrikopoulosandreas distributedimplementationofsemanticannotationtechniqueswithwikipediaentitiesbyusingcommunitypredictiontechniquesanddeepneuralnetworks |
_version_ |
1771297153528889344 |
spelling |
nemertes-10889-149552022-09-05T05:38:15Z Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής Distributed implementation of semantic annotation techniques with Wikipedia entities, by using community prediction techniques and deep neural networks. Ανδρικόπουλος, Ανδρέας Andrikopoulos, Andreas Σημασιολογική διασύνδεση οντοτήτων Αποσαφήνιση των λέξεων Εύρεση κοινοτήτων Πρόβλεψη κοινοτήτων Νευρωνικά δίκτυα Βαθιά μάθηση Named entity disambiguation Entity linking Word sense disambiguation Community detection Community prediction Deep neural networks Deep learning Wikipedia Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχνητής νοημοσύνης, της μηχανικής μάθησης κ.α.. Αποτελεί την ικανότητα αναγνώρισης της σωστής έννοιας των αναφορών μέσα σε ένα κείμενο με υπολογιστικό τρόπο. Η δυσκολία του προβλήματος έγκειται στο γεγονός ότι οι αναφορές αυτές πολλές φορές είναι αμφίσημες και πολύσημες ως προς τις οντότητες του κόσμου που αναπαριστούν. Μια εφαρμογή ονομαστικής αποσαφήνισης οντοτήτων είναι στο πρόβλημα του Wikification, το οποίο στοχεύει στην εύρεση των κυρίαρχων εννοιών μέσα σε ένα κείμενο και τη διασύνδεση αυτών με άρθρα της Wikipedia που έχουν αντίστοιχο εννοιολογικό περιεχόμενο με το εκάστοτε κείμενο. Η παρούσα μεταπτυχιακή εργασία επικεντρώνεται στο πρόβλημα της σημασιολογικής διασύνδεσης οντοτήτων μέσα από τη χρήση τεχνικών πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής. Η Wikipedia μπορεί να αναπαρασταθεί μέσω ενός γραφήματος με βαθύ σημασιολογικό περιεχόμενο, με κόμβους τα άρθρα και ακμές τους υπερσυνδέσμους μεταξύ των συ σχετιζόμενων άρθρων. Αντιμετωπίζοντας τα άρθρα σαν οντότητες, εφαρμόζουμε τεχνικές πρόβλεψης κοινοτήτων και τις ομαδοποιούμε με βάση το εννοιολογικό τους περιεχόμενο, με σκοπό να εξάγουμε τα κατάλληλα χαρακτηριστικά εκείνα που θα εκπαιδεύσουν την αρχιτεκτονική νευρωνικού δικτύου που επιλέχθηκε. Μέσα από την υλοποίηση και την αξιολόγηση μιας εγγενώς κατανεμημένης και βαθμωτής λύσης αποδεικνύεται η θετική συμβολή του χαρακτηριστικού της συνοχής της κοινότητας στο πρόβλημα της αποσαφήνισης οντοτήτων προσφέροντας ανταγωνιστικά αποτελέσματα, με ακρίβεια της τάξης του 81%. The semantic annotation of named entities with underlying conceptual information or otherwise Named Entity Disambiguation (NED) is among the most interesting open problems in natural language processing and is an important step in data preprocessing in the fields of information retrieval, artificial intelligence, machine learning etc. It is the ability to recognize the correct meaning of words in a textual context. The problem lies in the fact that, these references can often be characterized by high degree of ambiguity to the entities of the world they represent. An application of named entity disambiguation is the so-called Wikification, which aims to recognise the dominant entities within a text and annotate them with Wikipedia articles. This master thesis focuses on the problem of semantic annotation of named entities through the application of community prediction techniques and deep neural networks. Wikipedia articles can be represented by a directed graph with deep semantic information, in which the vertices represent web pages and directed edges represent links from one page to another. By treating articles as entities, we apply community prediction techniques and group entities based on their conceptual content, in order to derive appropriate features and train neural network models. Through the implementation and evaluation of an inherently distributed and scalable solution, proves that the feature of community coherence contributes positively to the problem of entity disambiguation by offering competitive results, with an accuracy of 81%. 2021-07-09T06:24:21Z 2021-07-09T06:24:21Z 2021-07-08 http://hdl.handle.net/10889/14955 gr application/pdf |