Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής

Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχν...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ανδρικόπουλος, Ανδρέας
Άλλοι συγγραφείς: Andrikopoulos, Andreas
Γλώσσα:Greek
Έκδοση: 2021
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/14955
id nemertes-10889-14955
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Σημασιολογική διασύνδεση οντοτήτων
Αποσαφήνιση των λέξεων
Εύρεση κοινοτήτων
Πρόβλεψη κοινοτήτων
Νευρωνικά δίκτυα
Βαθιά μάθηση
Named entity disambiguation
Entity linking
Word sense disambiguation
Community detection
Community prediction
Deep neural networks
Deep learning
Wikipedia
spellingShingle Σημασιολογική διασύνδεση οντοτήτων
Αποσαφήνιση των λέξεων
Εύρεση κοινοτήτων
Πρόβλεψη κοινοτήτων
Νευρωνικά δίκτυα
Βαθιά μάθηση
Named entity disambiguation
Entity linking
Word sense disambiguation
Community detection
Community prediction
Deep neural networks
Deep learning
Wikipedia
Ανδρικόπουλος, Ανδρέας
Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
description Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχνητής νοημοσύνης, της μηχανικής μάθησης κ.α.. Αποτελεί την ικανότητα αναγνώρισης της σωστής έννοιας των αναφορών μέσα σε ένα κείμενο με υπολογιστικό τρόπο. Η δυσκολία του προβλήματος έγκειται στο γεγονός ότι οι αναφορές αυτές πολλές φορές είναι αμφίσημες και πολύσημες ως προς τις οντότητες του κόσμου που αναπαριστούν. Μια εφαρμογή ονομαστικής αποσαφήνισης οντοτήτων είναι στο πρόβλημα του Wikification, το οποίο στοχεύει στην εύρεση των κυρίαρχων εννοιών μέσα σε ένα κείμενο και τη διασύνδεση αυτών με άρθρα της Wikipedia που έχουν αντίστοιχο εννοιολογικό περιεχόμενο με το εκάστοτε κείμενο. Η παρούσα μεταπτυχιακή εργασία επικεντρώνεται στο πρόβλημα της σημασιολογικής διασύνδεσης οντοτήτων μέσα από τη χρήση τεχνικών πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής. Η Wikipedia μπορεί να αναπαρασταθεί μέσω ενός γραφήματος με βαθύ σημασιολογικό περιεχόμενο, με κόμβους τα άρθρα και ακμές τους υπερσυνδέσμους μεταξύ των συ σχετιζόμενων άρθρων. Αντιμετωπίζοντας τα άρθρα σαν οντότητες, εφαρμόζουμε τεχνικές πρόβλεψης κοινοτήτων και τις ομαδοποιούμε με βάση το εννοιολογικό τους περιεχόμενο, με σκοπό να εξάγουμε τα κατάλληλα χαρακτηριστικά εκείνα που θα εκπαιδεύσουν την αρχιτεκτονική νευρωνικού δικτύου που επιλέχθηκε. Μέσα από την υλοποίηση και την αξιολόγηση μιας εγγενώς κατανεμημένης και βαθμωτής λύσης αποδεικνύεται η θετική συμβολή του χαρακτηριστικού της συνοχής της κοινότητας στο πρόβλημα της αποσαφήνισης οντοτήτων προσφέροντας ανταγωνιστικά αποτελέσματα, με ακρίβεια της τάξης του 81%.
author2 Andrikopoulos, Andreas
author_facet Andrikopoulos, Andreas
Ανδρικόπουλος, Ανδρέας
author Ανδρικόπουλος, Ανδρέας
author_sort Ανδρικόπουλος, Ανδρέας
title Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
title_short Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
title_full Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
title_fullStr Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
title_full_unstemmed Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
title_sort κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής
publishDate 2021
url http://hdl.handle.net/10889/14955
work_keys_str_mv AT andrikopoulosandreas katanemēmenēylopoiēsētechnikōnsēmasiologikēsdiasyndesēsmeontotēteswikipediametechnikesproblepsēskoinotētōnkaineurōnikōndiktyōnbathiasarchitektonikēs
AT andrikopoulosandreas distributedimplementationofsemanticannotationtechniqueswithwikipediaentitiesbyusingcommunitypredictiontechniquesanddeepneuralnetworks
_version_ 1771297153528889344
spelling nemertes-10889-149552022-09-05T05:38:15Z Κατανεμημένη υλοποίηση τεχνικών σημασιολογικής διασύνδεσης με οντότητες Wikipedia, με τεχνικές πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής Distributed implementation of semantic annotation techniques with Wikipedia entities, by using community prediction techniques and deep neural networks. Ανδρικόπουλος, Ανδρέας Andrikopoulos, Andreas Σημασιολογική διασύνδεση οντοτήτων Αποσαφήνιση των λέξεων Εύρεση κοινοτήτων Πρόβλεψη κοινοτήτων Νευρωνικά δίκτυα Βαθιά μάθηση Named entity disambiguation Entity linking Word sense disambiguation Community detection Community prediction Deep neural networks Deep learning Wikipedia Η σημασιολογική διασύνδεση οντοτήτων με υποκείμενη εννοιολογική πληροφορία ή αλλιώς ονομαστική αποσαφήνιση οντοτήτων είναι από τα πλέον ενδιαφέροντα ανοικτά προβλήματα στην επεξεργασία φυσικής γλώσσας και αποτελεί σημαντικό βήμα προεπεξεργασίας δεδομένων στα πεδία της ανάκτησης πληροφορίας, της τεχνητής νοημοσύνης, της μηχανικής μάθησης κ.α.. Αποτελεί την ικανότητα αναγνώρισης της σωστής έννοιας των αναφορών μέσα σε ένα κείμενο με υπολογιστικό τρόπο. Η δυσκολία του προβλήματος έγκειται στο γεγονός ότι οι αναφορές αυτές πολλές φορές είναι αμφίσημες και πολύσημες ως προς τις οντότητες του κόσμου που αναπαριστούν. Μια εφαρμογή ονομαστικής αποσαφήνισης οντοτήτων είναι στο πρόβλημα του Wikification, το οποίο στοχεύει στην εύρεση των κυρίαρχων εννοιών μέσα σε ένα κείμενο και τη διασύνδεση αυτών με άρθρα της Wikipedia που έχουν αντίστοιχο εννοιολογικό περιεχόμενο με το εκάστοτε κείμενο. Η παρούσα μεταπτυχιακή εργασία επικεντρώνεται στο πρόβλημα της σημασιολογικής διασύνδεσης οντοτήτων μέσα από τη χρήση τεχνικών πρόβλεψης κοινοτήτων και νευρωνικών δικτύων βαθιάς αρχιτεκτονικής. Η Wikipedia μπορεί να αναπαρασταθεί μέσω ενός γραφήματος με βαθύ σημασιολογικό περιεχόμενο, με κόμβους τα άρθρα και ακμές τους υπερσυνδέσμους μεταξύ των συ σχετιζόμενων άρθρων. Αντιμετωπίζοντας τα άρθρα σαν οντότητες, εφαρμόζουμε τεχνικές πρόβλεψης κοινοτήτων και τις ομαδοποιούμε με βάση το εννοιολογικό τους περιεχόμενο, με σκοπό να εξάγουμε τα κατάλληλα χαρακτηριστικά εκείνα που θα εκπαιδεύσουν την αρχιτεκτονική νευρωνικού δικτύου που επιλέχθηκε. Μέσα από την υλοποίηση και την αξιολόγηση μιας εγγενώς κατανεμημένης και βαθμωτής λύσης αποδεικνύεται η θετική συμβολή του χαρακτηριστικού της συνοχής της κοινότητας στο πρόβλημα της αποσαφήνισης οντοτήτων προσφέροντας ανταγωνιστικά αποτελέσματα, με ακρίβεια της τάξης του 81%. The semantic annotation of named entities with underlying conceptual information or otherwise Named Entity Disambiguation (NED) is among the most interesting open problems in natural language processing and is an important step in data preprocessing in the fields of information retrieval, artificial intelligence, machine learning etc. It is the ability to recognize the correct meaning of words in a textual context. The problem lies in the fact that, these references can often be characterized by high degree of ambiguity to the entities of the world they represent. An application of named entity disambiguation is the so-called Wikification, which aims to recognise the dominant entities within a text and annotate them with Wikipedia articles. This master thesis focuses on the problem of semantic annotation of named entities through the application of community prediction techniques and deep neural networks. Wikipedia articles can be represented by a directed graph with deep semantic information, in which the vertices represent web pages and directed edges represent links from one page to another. By treating articles as entities, we apply community prediction techniques and group entities based on their conceptual content, in order to derive appropriate features and train neural network models. Through the implementation and evaluation of an inherently distributed and scalable solution, proves that the feature of community coherence contributes positively to the problem of entity disambiguation by offering competitive results, with an accuracy of 81%. 2021-07-09T06:24:21Z 2021-07-09T06:24:21Z 2021-07-08 http://hdl.handle.net/10889/14955 gr application/pdf