Περίληψη: | Στα πλαίσια αυτής της διπλωματικής σχεδιάζεται και υλοποιείται το σύστημα BioSite, το οποίο αποτελεί ένα συστήμα επεξεργασίας και ανάλυσης βιοϊατρικής βιβλιογραφίας με στόχο την υποστήριξη ερωτημάτων.
Το σύστημα BioSite, έχει ως σκοπό του την υποστήριξη γρήγορων και
αποτελεσματικών αναζητήσεων στο πεδίο της βιοϊατρικής, καθώς και την
παρουσίαση των αποτελεσμάτων με φιλικό τρόπο ως προς τους χρήστες, με τα
αποτελέσματα να περιέχουν μόνο άρθρα των οποίων το πλήρες κείμενο είναι
άμεσα διαθέσιμο, κάτι που δεν παρέχεται από την PubMed Central και άλλες
ηλεκτρονικές βιβλιοθήκες, στις οποίες πολλά από τα επιστρεφόμενα
αποτελέσματα περιέχουν μόνο τις βασικές πληροφορίες και μια περίληψη των
άρθρων, με επιπρόσθετη πληροφορία πρόσβασης στο πλήρες κείμενο τους.
Το σύστημα συλλέγει μόνο τα άρθρα από την PubMed Central, με
δημόσια διαθέσιμο κείμενο, σχετικό με την βιοϊατρική και τα αποθηκεύει σε
τοπική βάση δεδομένων, ώστε να μειωθεί ο χρόνος αναζήτησης των πραγματικά
άμεσα διαθέσιμων άρθρων και ο χρήστης να απαλλαχθεί από την διαδικασία
ανίχνευσης τους σε ένα μεγάλο πλήθος αποτελεσμάτων. Στην συνέχεια, γίνεται
επεξεργασία τους με χρήση εργαλείων επεξεργασίας φυσικής γλώσσας, για την
εξαγωγή πληροφορίας σε μορφή σχολίων, που αφορά βιοϊατρικές έννοιες και τις
σχέσεις μεταξύ αυτών.
Η προκύπτουσα πληροφορία αποθηκεύεται σε μία βιοϊατρική οντολογία η
οποία δημιουργείται ειδικά για χρήση από το σύστημα, ως η συνένωση κάποιων
υπαρχόντων οντολογιών στο τομέα της βιοϊατρικής με τη προσθήκη όλων των
νέων απαραίτητων στοιχείων για την υποστήριξη του συνολικού συστήματος.
Αφού αποθηκευτεί η απαραίτητη πληροφορία στην οντολογία, στην συνέχεια
εφαρμόζεται ένας αλγόριθμος συσταδοποίησης για την κατηγοριοποίηση των
άρθρων. Ο αλγόριθμος σχεδιάστηκε ώστε να εκμεταλλεύεται τη δομή και την
πληροφορία της οντολογίας, ώστε η συσταδοποίηση, να μην βασίζεται σε όλους
τους βασικούς όρους των κειμένων για την εύρεση της ομοιότητας των κειμένων
αυτών, αλλά να χρησιμοποιεί μόνο τους βιοϊατρικούς όρους που ανιχνεύονται,
ώστε να οδηγεί σε κατηγοριοποίηση άρθρων βασισμένη στο περιεχόμενο με πιο
αυστηρό κριτήριο τον βιοϊατρικό χαρακτήρα του περιεχομένου αυτού. Τέλος, το
σύστημα παρέχει την δυνατότητα υποβολής ερωτήματων στην βάση – οντολογία
του συστήματος και παρουσίασης των αποτελεσμάτων μέσω της ιστοσελίδας του.
Τα ερωτήματα μπορεί να περιλαμβάνουν απλούς όρους αναζήτησης, βιοϊατρικούς
όρους ή να αφορούν συγκεκριμένα πεδία όπως συγγραφέα κτλ.
Όλες οι λειτουργίες του συστήματος διαχωρίζονται και υλοποιούνται από
έξι ξεχωριστά μέρη – υποσυστήματα, που αποτελούν αυτόνομα εργαλεία. Τα
υποσυστήματα αυτά είναι το CreateBase, το Crawler, το GateProcess, το
OntologyProcess, το ClusteringProcess και το BioSite Interface υποσύστημα.
|