Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων
Στα πλαίσια αυτής της διπλωματικής σχεδιάζεται και υλοποιείται το σύστημα BioSite, το οποίο αποτελεί ένα συστήμα επεξεργασίας και ανάλυσης βιοϊατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων. Το σύστημα BioSite, έχει ως σκοπό του την υποστήριξη γρήγορων και αποτελεσματικών αναζητήσεων στο...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2017
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/10364 |
id |
nemertes-10889-10364 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Βιοϊατρική Ανάλυση βιοϊατρικής βιβλιογραφίας Συσταδοποίηση Biomedicine Biomedical literature analysis Clustering 610.285 57 |
spellingShingle |
Βιοϊατρική Ανάλυση βιοϊατρικής βιβλιογραφίας Συσταδοποίηση Biomedicine Biomedical literature analysis Clustering 610.285 57 Μηνά, Ιωάννα Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
description |
Στα πλαίσια αυτής της διπλωματικής σχεδιάζεται και υλοποιείται το σύστημα BioSite, το οποίο αποτελεί ένα συστήμα επεξεργασίας και ανάλυσης βιοϊατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων.
Το σύστημα BioSite, έχει ως σκοπό του την υποστήριξη γρήγορων και
αποτελεσματικών αναζητήσεων στο πεδίο της βιοϊατρικής, καθώς και την
παρουσίαση των αποτελεσμάτων με φιλικό τρόπο ως προς τους χρήστες, με τα
αποτελέσματα να περιέχουν μόνο άρθρα των οποίων το πλήρες κείμενο είναι
άμεσα διαθέσιμο, κάτι που δεν παρέχεται από την PubMed Central και άλλες
ηλεκτρονικές βιβλιοθήκες, στις οποίες πολλά από τα επιστρεφόμενα
αποτελέσματα περιέχουν μόνο τις βασικές πληροφορίες και μια περίληψη των
άρθρων, με επιπρόσθετη πληροφορία πρόσβασης στο πλήρες κείμενο τους.
Το σύστημα συλλέγει μόνο τα άρθρα από την PubMed Central, με
δημόσια διαθέσιμο κείμενο, σχετικό με την βιοϊατρική και τα αποθηκεύει σε
τοπική βάση δεδομένων, ώστε να μειωθεί ο χρόνος αναζήτησης των πραγματικά
άμεσα διαθέσιμων άρθρων και ο χρήστης να απαλλαχθεί από την διαδικασία
ανίχνευσης τους σε ένα μεγάλο πλήθος αποτελεσμάτων. Στην συνέχεια, γίνεται
επεξεργασία τους με χρήση εργαλείων επεξεργασίας φυσικής γλώσσας, για την
εξαγωγή πληροφορίας σε μορφή σχολίων, που αφορά βιοϊατρικές έννοιες και τις
σχέσεις μεταξύ αυτών.
Η προκύπτουσα πληροφορία αποθηκεύεται σε μία βιοϊατρική οντολογία η
οποία δημιουργείται ειδικά για χρήση από το σύστημα, ως η συνένωση κάποιων
υπαρχόντων οντολογιών στο τομέα της βιοϊατρικής με τη προσθήκη όλων των
νέων απαραίτητων στοιχείων για την υποστήριξη του συνολικού συστήματος.
Αφού αποθηκευτεί η απαραίτητη πληροφορία στην οντολογία, στην συνέχεια
εφαρμόζεται ένας αλγόριθμος συσταδοποίησης για την κατηγοριοποίηση των
άρθρων. Ο αλγόριθμος σχεδιάστηκε ώστε να εκμεταλλεύεται τη δομή και την
πληροφορία της οντολογίας, ώστε η συσταδοποίηση, να μην βασίζεται σε όλους
τους βασικούς όρους των κειμένων για την εύρεση της ομοιότητας των κειμένων
αυτών, αλλά να χρησιμοποιεί μόνο τους βιοϊατρικούς όρους που ανιχνεύονται,
ώστε να οδηγεί σε κατηγοριοποίηση άρθρων βασισμένη στο περιεχόμενο με πιο
αυστηρό κριτήριο τον βιοϊατρικό χαρακτήρα του περιεχομένου αυτού. Τέλος, το
σύστημα παρέχει την δυνατότητα υποβολής ερωτήματων στην βάση – οντολογία
του συστήματος και παρουσίασης των αποτελεσμάτων μέσω της ιστοσελίδας του.
Τα ερωτήματα μπορεί να περιλαμβάνουν απλούς όρους αναζήτησης, βιοϊατρικούς
όρους ή να αφορούν συγκεκριμένα πεδία όπως συγγραφέα κτλ.
Όλες οι λειτουργίες του συστήματος διαχωρίζονται και υλοποιούνται από
έξι ξεχωριστά μέρη – υποσυστήματα, που αποτελούν αυτόνομα εργαλεία. Τα
υποσυστήματα αυτά είναι το CreateBase, το Crawler, το GateProcess, το
OntologyProcess, το ClusteringProcess και το BioSite Interface υποσύστημα. |
author2 |
Χατζηλυγερούδης, Ιωάννης |
author_facet |
Χατζηλυγερούδης, Ιωάννης Μηνά, Ιωάννα |
format |
Thesis |
author |
Μηνά, Ιωάννα |
author_sort |
Μηνά, Ιωάννα |
title |
Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
title_short |
Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
title_full |
Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
title_fullStr |
Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
title_full_unstemmed |
Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
title_sort |
σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων |
publishDate |
2017 |
url |
http://hdl.handle.net/10889/10364 |
work_keys_str_mv |
AT mēnaiōanna systēmaepexergasiaskaianalysēsbioiatrikēsbibliographiasmestochotēnypostērixēerōtēmatōn AT mēnaiōanna biomedicalliteratureprocessingandanalysissystemforsupportingqueries |
_version_ |
1771297161703587840 |
spelling |
nemertes-10889-103642022-09-05T05:37:43Z Σύστημα επεξεργασίας και ανάλυσης βιο-ιατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων Biomedical literature processing and analysis system for supporting queries Μηνά, Ιωάννα Χατζηλυγερούδης, Ιωάννης Χατζηλυγερούδης, Ιωάννης Μεγαλοοικονόμου, Βασίλειος Μακρής, Χρήστος Mina, Ioanna Βιοϊατρική Ανάλυση βιοϊατρικής βιβλιογραφίας Συσταδοποίηση Biomedicine Biomedical literature analysis Clustering 610.285 57 Στα πλαίσια αυτής της διπλωματικής σχεδιάζεται και υλοποιείται το σύστημα BioSite, το οποίο αποτελεί ένα συστήμα επεξεργασίας και ανάλυσης βιοϊατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων. Το σύστημα BioSite, έχει ως σκοπό του την υποστήριξη γρήγορων και αποτελεσματικών αναζητήσεων στο πεδίο της βιοϊατρικής, καθώς και την παρουσίαση των αποτελεσμάτων με φιλικό τρόπο ως προς τους χρήστες, με τα αποτελέσματα να περιέχουν μόνο άρθρα των οποίων το πλήρες κείμενο είναι άμεσα διαθέσιμο, κάτι που δεν παρέχεται από την PubMed Central και άλλες ηλεκτρονικές βιβλιοθήκες, στις οποίες πολλά από τα επιστρεφόμενα αποτελέσματα περιέχουν μόνο τις βασικές πληροφορίες και μια περίληψη των άρθρων, με επιπρόσθετη πληροφορία πρόσβασης στο πλήρες κείμενο τους. Το σύστημα συλλέγει μόνο τα άρθρα από την PubMed Central, με δημόσια διαθέσιμο κείμενο, σχετικό με την βιοϊατρική και τα αποθηκεύει σε τοπική βάση δεδομένων, ώστε να μειωθεί ο χρόνος αναζήτησης των πραγματικά άμεσα διαθέσιμων άρθρων και ο χρήστης να απαλλαχθεί από την διαδικασία ανίχνευσης τους σε ένα μεγάλο πλήθος αποτελεσμάτων. Στην συνέχεια, γίνεται επεξεργασία τους με χρήση εργαλείων επεξεργασίας φυσικής γλώσσας, για την εξαγωγή πληροφορίας σε μορφή σχολίων, που αφορά βιοϊατρικές έννοιες και τις σχέσεις μεταξύ αυτών. Η προκύπτουσα πληροφορία αποθηκεύεται σε μία βιοϊατρική οντολογία η οποία δημιουργείται ειδικά για χρήση από το σύστημα, ως η συνένωση κάποιων υπαρχόντων οντολογιών στο τομέα της βιοϊατρικής με τη προσθήκη όλων των νέων απαραίτητων στοιχείων για την υποστήριξη του συνολικού συστήματος. Αφού αποθηκευτεί η απαραίτητη πληροφορία στην οντολογία, στην συνέχεια εφαρμόζεται ένας αλγόριθμος συσταδοποίησης για την κατηγοριοποίηση των άρθρων. Ο αλγόριθμος σχεδιάστηκε ώστε να εκμεταλλεύεται τη δομή και την πληροφορία της οντολογίας, ώστε η συσταδοποίηση, να μην βασίζεται σε όλους τους βασικούς όρους των κειμένων για την εύρεση της ομοιότητας των κειμένων αυτών, αλλά να χρησιμοποιεί μόνο τους βιοϊατρικούς όρους που ανιχνεύονται, ώστε να οδηγεί σε κατηγοριοποίηση άρθρων βασισμένη στο περιεχόμενο με πιο αυστηρό κριτήριο τον βιοϊατρικό χαρακτήρα του περιεχομένου αυτού. Τέλος, το σύστημα παρέχει την δυνατότητα υποβολής ερωτήματων στην βάση – οντολογία του συστήματος και παρουσίασης των αποτελεσμάτων μέσω της ιστοσελίδας του. Τα ερωτήματα μπορεί να περιλαμβάνουν απλούς όρους αναζήτησης, βιοϊατρικούς όρους ή να αφορούν συγκεκριμένα πεδία όπως συγγραφέα κτλ. Όλες οι λειτουργίες του συστήματος διαχωρίζονται και υλοποιούνται από έξι ξεχωριστά μέρη – υποσυστήματα, που αποτελούν αυτόνομα εργαλεία. Τα υποσυστήματα αυτά είναι το CreateBase, το Crawler, το GateProcess, το OntologyProcess, το ClusteringProcess και το BioSite Interface υποσύστημα. This Τhesis objective is to design and implement the BioSite system, which is a biomedical literature processing and analysis system for supporting queries. The BioSite system is designed to support fast and efficient searches in the biomedical field and also to present the results in a user - friendly way. The results can only contain articles whose full content is directly available, something not provided by PubMed Central and other online libraries, where many of the returned results contain only the basic information and a summary of the articles, providing access to external sources for further information. The system collects articles from PubMed Central, with publicly available content related to biomedicine and stores them in a local database, in order to reduce the search time of actually available articles by preventing a detection process within a large number of results. Then, the articles are processed, using natural language processing tools, in order to extract information about biomedical concepts and the relationships among them, in the form of annotations. The resulting information is stored in a biomedical ontology which was created specifically for BioSite system, as the combination of some existing ontologies in the biomedical field with all the new elements necessary to support the overall system. Once the necessary information is stored in the ontology, a clustering algorithm is applied to categorize the articles. The algorithm is designed to exploit the structure and the information within the ontology so that the clustering, can be done by using only biomedical terms in order to find the similarity among the articles, instead of using all of their basic terms. Thus, the categorization of the articles is focused on the biomedical aspect of the article's content. The system also provides the ability to query the system's database - ontology and display the results on its website. Queries may consist of simple search terms, biomedical terms or regard specific search areas like author etc. BioSite's functions are separated and carried out by six modules – subsystems, that are in fact independent tools. These subsystems are the CreateBase, the Crawler, the GateProcess, the OntologyProcess, the ClusteringProcess and the BioSite Interface. 2017-06-02T08:10:12Z 2017-06-02T08:10:12Z 2017-02-28 Thesis http://hdl.handle.net/10889/10364 gr 0 application/pdf |