Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας
Η συγκεκριμένη διπλωματική εργασία δημιουργήθηκε στα πλαίσια της έρευνας όσον αφορά την σχέση που θα μπορούσε να αναπτυχθεί ανάμεσα σε chatbots και βιοϊατρικά δεδομένα. Πιο συγκεκριμένα, η ιστορία των chatbots μας έχει αποδείξει πως η εξέλιξη τους είναι συνεχής και οι δυνατότητές τους αέναες. Ωστόσο...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Γλώσσα: | Greek |
Έκδοση: |
2022
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/16418 |
id |
nemertes-10889-16418 |
---|---|
record_format |
dspace |
spelling |
nemertes-10889-164182022-09-05T20:18:38Z Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας Implementation of a chatbot infrastructure for the utilization of biomedical information Ξύγκη, Ευδοκία Xygki, Evdokia Βιοϊατρική Βιοϊατρικά δεδομένα Chatbot Biomedical Η συγκεκριμένη διπλωματική εργασία δημιουργήθηκε στα πλαίσια της έρευνας όσον αφορά την σχέση που θα μπορούσε να αναπτυχθεί ανάμεσα σε chatbots και βιοϊατρικά δεδομένα. Πιο συγκεκριμένα, η ιστορία των chatbots μας έχει αποδείξει πως η εξέλιξη τους είναι συνεχής και οι δυνατότητές τους αέναες. Ωστόσο, οι δυνατότητές τους σε βιοϊατρικά δεδομένα βρίσκονται ακόμη υπό εξερεύνηση και αυτός είναι και ο λόγος ύπαρξης της συγκεκριμένης διπλωματικής. Επιλέγοντας την δημιουργία ενός qa chatbot και την εισαγωγή βιοϊατρικών δεδομένων - και μη - σε αυτό, στοχεύουμε μέσω διαφόρων δοκιμών να αξιολογήσουμε πιθανές επιδόσεις και να εξάγουμε παρατηρήσεις σχετικά με την αντίδραση του chatbot σε κάθε περίπτωση. Πιο συγκεκριμένα, όσον αφορά τα δεδομένα που χρησιμοποιήθηκαν, χρησιμοποιήσαμε 1100 Abstracts από ιατρικά papers της βιβλιοθήκης PubMed, καθώς και 250 SQuAD v2.0 δεδομένα, λόγω περιορισμένης υπολογιστικής ισχύος. Τα παραπάνω δείγματα, διαχωρίστηκαν σε προτάσεις, μετά την είσοδό τους στο πρόγραμμα, προσφέροντας 8737 προτάσεις για σύγκριση. Κατά τις δοκιμές χρησιμοποιήθηκε ο αλγόριθμος Bert σε τέσσερις διαφορετικές μορφές, το Roberta, Bert Large, Xlm-r και Biobert. Ωστόσο, θέλαμε να παρατηρήσουμε και πως θα αντιδρούσε το chatbot και χωρίς αλγόριθμο και έτσι αξιοποιήσαμε τον CountVectorizer, ο οποίος αποδείχτηκε και ο πιο αποτελεσματικός εκ των πέντε. Όσον αφορά την αξιολόγηση, πραγματοποιήθηκαν 100 πειράματα σε κάθε περίπτωση, άρα συνολικά 500 πειραματικές ερωτήσεις και απαντήσεις, οι οποίες αξιολογήθηκαν με βάση τις απαντήσεις που έδινε το εκάστοτε chatbot και τις απαντήσεις που κρίναμε εμείς ως ορθές. Οι συγκεκριμένες απαντήσεις συγκρίθηκαν και αξιολογήθηκαν όσον αφορά τις ομοιότητές τους, μέσω των μετρικών f1 score, precision και recall, μετρικές οι οποίες υπολογίστηκαν συνολικά και έδωσαν συγκρίσιμα αποτελέσματα, φέρνοντας τον CounterVectonizer στην πρώτη θέση με τα Roberta, Bert Large, Xlm-r και Biobert να ακολουθούν. This thesis was created in the context of research on the relationship that could be developed between chatbots and biomedical data. More specifically, the history of chatbots has shown us that their evolution is continuous and their potential is endless. However, their potential in biomedical data is still being explored and that is the reason for the existence of this thesis. By choosing to create a qa chatbot and inserting biomedical data - and not - into it, we aim through various tests to evaluate possible performance and to make observations about the reaction of the chatbot in each case. More specifically, in terms of the data used, we used 1100 abstracts from medical papers of the PubMed library, as well as 250 SQuAD v2.0 data, due to limited computing power. The above samples were divided into sentences, after entering the program, offering 8,737 sentences for comparison. The Bert algorithm was used in the tests in four different models, Roberta, Bert Large, Xlm-r and Biobert. However, we also wanted to observe how the chatbot would react without an algorithm, so we used CountVectorizer, which proved to be the most effective of the five. In terms of evaluation, 100 experiments were performed in each case, so a total of 500 experimental questions and answers, which were evaluated based on the answers given by each chatbot and the answers that we judged to be correct. The specific answers were compared and evaluated in terms of their similarities, through the metrics f1 score, precision and recall, metrics which were calculated overall and gave comparable results, bringing CounterVectonizer in the first place with Roberta, Bert Large, Xlm-r and Biobert to follow. 2022-07-07T09:59:33Z 2022-07-07T09:59:33Z 2022-07-06 http://hdl.handle.net/10889/16418 gr application/pdf |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Βιοϊατρική Βιοϊατρικά δεδομένα Chatbot Biomedical |
spellingShingle |
Βιοϊατρική Βιοϊατρικά δεδομένα Chatbot Biomedical Ξύγκη, Ευδοκία Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
description |
Η συγκεκριμένη διπλωματική εργασία δημιουργήθηκε στα πλαίσια της έρευνας όσον αφορά την σχέση που θα μπορούσε να αναπτυχθεί ανάμεσα σε chatbots και βιοϊατρικά δεδομένα. Πιο συγκεκριμένα, η ιστορία των chatbots μας έχει αποδείξει πως η εξέλιξη τους είναι συνεχής και οι δυνατότητές τους αέναες. Ωστόσο, οι δυνατότητές τους σε βιοϊατρικά δεδομένα βρίσκονται ακόμη υπό εξερεύνηση και αυτός είναι και ο λόγος ύπαρξης της συγκεκριμένης διπλωματικής. Επιλέγοντας την δημιουργία ενός qa chatbot και την εισαγωγή βιοϊατρικών δεδομένων - και μη - σε αυτό, στοχεύουμε μέσω διαφόρων δοκιμών να αξιολογήσουμε πιθανές επιδόσεις και να εξάγουμε παρατηρήσεις σχετικά με την αντίδραση του chatbot σε κάθε περίπτωση.
Πιο συγκεκριμένα, όσον αφορά τα δεδομένα που χρησιμοποιήθηκαν, χρησιμοποιήσαμε 1100 Abstracts από ιατρικά papers της βιβλιοθήκης PubMed, καθώς και 250 SQuAD v2.0 δεδομένα, λόγω περιορισμένης υπολογιστικής ισχύος. Τα παραπάνω δείγματα, διαχωρίστηκαν σε προτάσεις, μετά την είσοδό τους στο πρόγραμμα, προσφέροντας 8737 προτάσεις για σύγκριση. Κατά τις δοκιμές χρησιμοποιήθηκε ο αλγόριθμος Bert σε τέσσερις διαφορετικές μορφές, το Roberta, Bert Large, Xlm-r και Biobert. Ωστόσο, θέλαμε να παρατηρήσουμε και πως θα αντιδρούσε το chatbot και χωρίς αλγόριθμο και έτσι αξιοποιήσαμε τον CountVectorizer, ο οποίος αποδείχτηκε και ο πιο αποτελεσματικός εκ των πέντε.
Όσον αφορά την αξιολόγηση, πραγματοποιήθηκαν 100 πειράματα σε κάθε περίπτωση, άρα συνολικά 500 πειραματικές ερωτήσεις και απαντήσεις, οι οποίες αξιολογήθηκαν με βάση τις απαντήσεις που έδινε το εκάστοτε chatbot και τις απαντήσεις που κρίναμε εμείς ως ορθές. Οι συγκεκριμένες απαντήσεις συγκρίθηκαν και αξιολογήθηκαν όσον αφορά τις ομοιότητές τους, μέσω των μετρικών f1 score, precision και recall, μετρικές οι οποίες υπολογίστηκαν συνολικά και έδωσαν συγκρίσιμα αποτελέσματα, φέρνοντας τον CounterVectonizer στην πρώτη θέση με τα Roberta, Bert Large, Xlm-r και Biobert να ακολουθούν. |
author2 |
Xygki, Evdokia |
author_facet |
Xygki, Evdokia Ξύγκη, Ευδοκία |
author |
Ξύγκη, Ευδοκία |
author_sort |
Ξύγκη, Ευδοκία |
title |
Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
title_short |
Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
title_full |
Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
title_fullStr |
Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
title_full_unstemmed |
Υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
title_sort |
υλοποίηση υποδομής chatbot για την αξιοποίηση βιοϊατρικής πληροφορίας |
publishDate |
2022 |
url |
http://hdl.handle.net/10889/16418 |
work_keys_str_mv |
AT xynkēeudokia ylopoiēsēypodomēschatbotgiatēnaxiopoiēsēbioïatrikēsplērophorias AT xynkēeudokia implementationofachatbotinfrastructurefortheutilizationofbiomedicalinformation |
_version_ |
1771297293693091840 |