Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων
Τα τελευταία χρόνια είναι έντονο το φαινόμενο της αύξησης και συσσώρευσης βιολογικών δεδομένων σε διεθνείς βάσεις δεδομένων. Ο μεγάλος αριθμός των καταχωρημένων νουκλεοτιδικών αλληλουχιών (π.χ. ολόκληρα γονιδιώματα, ESTs DNA και mRNA) και πρωτεϊνικών αλληλουχιών, των τρισδιάστατων δομών των βιομακρο...
Κύριος συγγραφέας: | |
---|---|
Άλλοι συγγραφείς: | |
Μορφή: | Thesis |
Γλώσσα: | Greek |
Έκδοση: |
2018
|
Θέματα: | |
Διαθέσιμο Online: | http://hdl.handle.net/10889/11660 |
id |
nemertes-10889-11660 |
---|---|
record_format |
dspace |
institution |
UPatras |
collection |
Nemertes |
language |
Greek |
topic |
Βιολογικά δεδομένα Οπτικοποίηση δεδομένων Έξόρυξη γνώσης από δεδομένα Βάσεις βιολογικών δεδομένων Βιοπληροφορική Βιοπληροφορική ανάλυση Εργαλεία βιοπληροφορικής Biological data Data visualization Data mining Biological databases Bioinformatics Bioinformatic analysis Bioinformatic tools 570.285 57 |
spellingShingle |
Βιολογικά δεδομένα Οπτικοποίηση δεδομένων Έξόρυξη γνώσης από δεδομένα Βάσεις βιολογικών δεδομένων Βιοπληροφορική Βιοπληροφορική ανάλυση Εργαλεία βιοπληροφορικής Biological data Data visualization Data mining Biological databases Bioinformatics Bioinformatic analysis Bioinformatic tools 570.285 57 Χατζής, Ιωάννης Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
description |
Τα τελευταία χρόνια είναι έντονο το φαινόμενο της αύξησης και συσσώρευσης βιολογικών δεδομένων σε διεθνείς βάσεις δεδομένων. Ο μεγάλος αριθμός των καταχωρημένων νουκλεοτιδικών αλληλουχιών (π.χ. ολόκληρα γονιδιώματα, ESTs DNA και mRNA) και πρωτεϊνικών αλληλουχιών, των τρισδιάστατων δομών των βιομακρομορίων, καθώς επίσης και η χαρτογράφηση και αλληλούχηση ολόκληρων γονιδιωμάτων, είχε ως αποτέλεσμα τη συγκέντρωση ενός τεράστιου όγκου ακατέργαστων δεδομένων εκτεταμένης πολυπλοκότητας. Οι ερευνητές για να ανταποκριθούν σ’ αυτή την πρόκληση έκριναν απαραίτητη τη χρήση ηλεκτρονικών υπολογιστών για την αποτελεσματική αποθήκευση, οργάνωση, ανάλυση και ερμηνεία αυτής της πληθώρας βιολογικών δεδομένων. Με την ταυτόχρονη έντονη ανάπτυξη της Πληροφορικής, δημιουργήθηκαν οι κατάλληλες προϋποθέσεις για την ανάπτυξη ενός νέου και συνεχώς εξελισσόμενου επιστημονικού πεδίου, της Βιοπληροφορικής.Η πρώτη εφαρμογή δημιουργήθηκε χρησιμοποιώντας τεχνολογία και εργαλεία που αναπτύχθηκαν και υποστηρίζονται από τη Microsoft. Πρόκειται για την RGDtrip, μια εφαρμογή που σχεδιάστηκε και υλοποιήθηκε, με σκοπό την αποθήκευση, διαχείριση και επεξεργασία δεδομένων πρωτεϊνών που περιέχουν το τριπεπτίδιο RGD. Το ερευνητικό ενδιαφέρον εμφανίστηκε από την πρώτη βιβλιογραφική ανασκόπηση και αξιολόγηση όλων των αλληλουχιών RGD και βρόχων σε υποδοχείς μεταξύ των ειδών το 1998 και την επαλήθευση ότι η εμφάνιση τέτοιων αλληλουχιών σε υποδοχείς θα μπορούσε να σημαίνει ότι αυτές οι αλληλουχίες θα ήταν σε δομές τύπου βρόχου / βρόχου και ότι αυτές οι δομές θηλειάς θα μπορούσαν να συνεπάγονται επίσης λειτουργία κυτταρικής προσκόλλησης για υποδοχείς. Αυτό δημιούργησε μια ενδιαφέρουσα υπόθεση, ότι οι βρόχοι RGD μπορούν να προσθέσουν μια συνάρτηση κυτταρικής προσκόλλησης στους υποδοχείς. Η ανάγκη φυλογενετικής και συγκριτικής λειτουργικής έρευνας, απαιτεί ισχυρές αλλά διαισθητικές και φιλικές προς τον χρήστη μαζικές δοκιμές σύγκρισης για την επίτευξη αρχικών αποτελεσμάτων συσχετισμού. Ως αποτέλεσμα, υπάρχει μια επιτακτική ανάγκη να αντιπροσωπεύονται οι πληροφορίες σε οπτική μορφή, επιτρέποντας στους ερευνητές να αναλύουν τα δεδομένα και να αποκτούν ουσιαστικές γνώσεις, αποκαλύπτοντας τα υποκείμενα μοντέλα και ενδεχομένως, προηγούμενες αόρατες συσχετίσεις μεταξύ μεγάλων συνόλων δεδομένων.Για τη δημιουργία της δεύτερης εφαρμογής χρησιμοποιήθηκαν εργαλεία ελεύθερου λογισμικού και λογισμικό ανοικτού κώδικα (ΕΛ/ΛΑΚ). Η εφαρμογή fungibase δημιουργήθηκε με σκοπό την καταγραφή και αποθήκευση των διαφόρων ψηφιακών καταθετηρίων, που επικεντρώνονταν σε χαρακτηριστικά του μικροοργανισμού ενδιαφέροντος (αλληλουχίες, μεταβολικές οδούς, φαινοτύπος) και όχι στον υποκείμενο μεθοδολογικό ιστό. Πιο συγκεκριμένα, η αλματώδης εξέλιξη της μοριακής (αλλά και της συμβατικής) μυκητολογίας στη Φαρμακευτική έρευνα, σε ιατρικό, φαρμακευτικό και βιοτεχνολογικό επίπεδο δημιούργησε ένα χάος ως προς την πρόσβαση στα αποτελέσματα της αντίστοιχης έρευνας που υπήρξε ογκώδης, άναρχη, πολυδιασπασμένη και ευκαιριακή.Ωστόσο, ο αρχικός σχεδιασμός της fungibase δεν αφορά σε σύνθετες λειτουργίες και πολύπλοκη επεξεργασία ή εξόρυξη δεδομένων. Περιλαμβάνει στοιχειώδη εργαλεία αναζήτησης και οπτικοποίησης των δεδομένων της βάσης δεδομένων. Δίνει τη δυνατότητα στον ερευνητή να αναζητήσει πληροφορίες με βάση τη μεθοδολογία, πεδία μεθοδολογίας ή/και είδη μυκήτων, προκειμένου να ελεγχθεί αν μια τεχνική έχει εφαρμοστεί σε συγκεκριμένο μύκητα και τι αποτελέσματα είχε, ή το σε ποια είδη έχει εφαρμοστεί μια μέθοδος ή παράμετρος μεθόδου και τα αποτελέσματα, μαζί με τις μεθοδολογικές αποκλίσεις (πχ εκκινητές PCR σε διαφορετικά είδη μυκήτων με διαφορετικά προγράμματα θερμικών κυκλοποιητών).Και στις δύο περιπτώσεις, έγινε προσπάθεια εφαρμογής της νέα και πολλά υποσχόμενης προσέγγισης για την επεξήγηση των δεδομένων, γνωστή ως οπτική εξόρυξη δεδομένων, που προέκυψε από την τεχνολογική σύζευξη των αυτοματοποιημένων αλγορίθμων εξόρυξης δεδομένων και των τεχνικών οπτικοποίησης. Η αξιοποίηση τόσο των μεθόδων αυτόματης ανάλυσης όσο και της ανθρώπινης αντίληψης υπόσχεται πιο αποτελεσματική επιθεώρηση, κατανόηση και αλληλεπίδραση με τεράστιες συλλογές δεδομένων. |
author2 |
Πουλάς, Κωνσταντίνος |
author_facet |
Πουλάς, Κωνσταντίνος Χατζής, Ιωάννης |
format |
Thesis |
author |
Χατζής, Ιωάννης |
author_sort |
Χατζής, Ιωάννης |
title |
Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
title_short |
Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
title_full |
Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
title_fullStr |
Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
title_full_unstemmed |
Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
title_sort |
εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων |
publishDate |
2018 |
url |
http://hdl.handle.net/10889/11660 |
work_keys_str_mv |
AT chatzēsiōannēs epharmogesapeikonisēskaiexoryxēsdedomenōnsebiologikesbaseisdedomenōn AT chatzēsiōannēs visualizationapplicationsanddataminingonbiologicaldatabases |
_version_ |
1771297352277032960 |
spelling |
nemertes-10889-116602022-09-05T20:21:52Z Εφαρμογές απεικόνισης και εξόρυξης δεδομένων σε βιολογικές βάσεις δεδομένων Visualization applications and data mining on biological databases Χατζής, Ιωάννης Πουλάς, Κωνσταντίνος Τζήμας, Ιωάννης Πατρινός, Γεώργιος Σπυρούλιας, Γεώργιος Σιβολαπένκο, Γρηγόριος Παυλίδης, Γεώργιος Σιούτας, Σπυρίδων Chatzis, Ioannis Βιολογικά δεδομένα Οπτικοποίηση δεδομένων Έξόρυξη γνώσης από δεδομένα Βάσεις βιολογικών δεδομένων Βιοπληροφορική Βιοπληροφορική ανάλυση Εργαλεία βιοπληροφορικής Biological data Data visualization Data mining Biological databases Bioinformatics Bioinformatic analysis Bioinformatic tools 570.285 57 Τα τελευταία χρόνια είναι έντονο το φαινόμενο της αύξησης και συσσώρευσης βιολογικών δεδομένων σε διεθνείς βάσεις δεδομένων. Ο μεγάλος αριθμός των καταχωρημένων νουκλεοτιδικών αλληλουχιών (π.χ. ολόκληρα γονιδιώματα, ESTs DNA και mRNA) και πρωτεϊνικών αλληλουχιών, των τρισδιάστατων δομών των βιομακρομορίων, καθώς επίσης και η χαρτογράφηση και αλληλούχηση ολόκληρων γονιδιωμάτων, είχε ως αποτέλεσμα τη συγκέντρωση ενός τεράστιου όγκου ακατέργαστων δεδομένων εκτεταμένης πολυπλοκότητας. Οι ερευνητές για να ανταποκριθούν σ’ αυτή την πρόκληση έκριναν απαραίτητη τη χρήση ηλεκτρονικών υπολογιστών για την αποτελεσματική αποθήκευση, οργάνωση, ανάλυση και ερμηνεία αυτής της πληθώρας βιολογικών δεδομένων. Με την ταυτόχρονη έντονη ανάπτυξη της Πληροφορικής, δημιουργήθηκαν οι κατάλληλες προϋποθέσεις για την ανάπτυξη ενός νέου και συνεχώς εξελισσόμενου επιστημονικού πεδίου, της Βιοπληροφορικής.Η πρώτη εφαρμογή δημιουργήθηκε χρησιμοποιώντας τεχνολογία και εργαλεία που αναπτύχθηκαν και υποστηρίζονται από τη Microsoft. Πρόκειται για την RGDtrip, μια εφαρμογή που σχεδιάστηκε και υλοποιήθηκε, με σκοπό την αποθήκευση, διαχείριση και επεξεργασία δεδομένων πρωτεϊνών που περιέχουν το τριπεπτίδιο RGD. Το ερευνητικό ενδιαφέρον εμφανίστηκε από την πρώτη βιβλιογραφική ανασκόπηση και αξιολόγηση όλων των αλληλουχιών RGD και βρόχων σε υποδοχείς μεταξύ των ειδών το 1998 και την επαλήθευση ότι η εμφάνιση τέτοιων αλληλουχιών σε υποδοχείς θα μπορούσε να σημαίνει ότι αυτές οι αλληλουχίες θα ήταν σε δομές τύπου βρόχου / βρόχου και ότι αυτές οι δομές θηλειάς θα μπορούσαν να συνεπάγονται επίσης λειτουργία κυτταρικής προσκόλλησης για υποδοχείς. Αυτό δημιούργησε μια ενδιαφέρουσα υπόθεση, ότι οι βρόχοι RGD μπορούν να προσθέσουν μια συνάρτηση κυτταρικής προσκόλλησης στους υποδοχείς. Η ανάγκη φυλογενετικής και συγκριτικής λειτουργικής έρευνας, απαιτεί ισχυρές αλλά διαισθητικές και φιλικές προς τον χρήστη μαζικές δοκιμές σύγκρισης για την επίτευξη αρχικών αποτελεσμάτων συσχετισμού. Ως αποτέλεσμα, υπάρχει μια επιτακτική ανάγκη να αντιπροσωπεύονται οι πληροφορίες σε οπτική μορφή, επιτρέποντας στους ερευνητές να αναλύουν τα δεδομένα και να αποκτούν ουσιαστικές γνώσεις, αποκαλύπτοντας τα υποκείμενα μοντέλα και ενδεχομένως, προηγούμενες αόρατες συσχετίσεις μεταξύ μεγάλων συνόλων δεδομένων.Για τη δημιουργία της δεύτερης εφαρμογής χρησιμοποιήθηκαν εργαλεία ελεύθερου λογισμικού και λογισμικό ανοικτού κώδικα (ΕΛ/ΛΑΚ). Η εφαρμογή fungibase δημιουργήθηκε με σκοπό την καταγραφή και αποθήκευση των διαφόρων ψηφιακών καταθετηρίων, που επικεντρώνονταν σε χαρακτηριστικά του μικροοργανισμού ενδιαφέροντος (αλληλουχίες, μεταβολικές οδούς, φαινοτύπος) και όχι στον υποκείμενο μεθοδολογικό ιστό. Πιο συγκεκριμένα, η αλματώδης εξέλιξη της μοριακής (αλλά και της συμβατικής) μυκητολογίας στη Φαρμακευτική έρευνα, σε ιατρικό, φαρμακευτικό και βιοτεχνολογικό επίπεδο δημιούργησε ένα χάος ως προς την πρόσβαση στα αποτελέσματα της αντίστοιχης έρευνας που υπήρξε ογκώδης, άναρχη, πολυδιασπασμένη και ευκαιριακή.Ωστόσο, ο αρχικός σχεδιασμός της fungibase δεν αφορά σε σύνθετες λειτουργίες και πολύπλοκη επεξεργασία ή εξόρυξη δεδομένων. Περιλαμβάνει στοιχειώδη εργαλεία αναζήτησης και οπτικοποίησης των δεδομένων της βάσης δεδομένων. Δίνει τη δυνατότητα στον ερευνητή να αναζητήσει πληροφορίες με βάση τη μεθοδολογία, πεδία μεθοδολογίας ή/και είδη μυκήτων, προκειμένου να ελεγχθεί αν μια τεχνική έχει εφαρμοστεί σε συγκεκριμένο μύκητα και τι αποτελέσματα είχε, ή το σε ποια είδη έχει εφαρμοστεί μια μέθοδος ή παράμετρος μεθόδου και τα αποτελέσματα, μαζί με τις μεθοδολογικές αποκλίσεις (πχ εκκινητές PCR σε διαφορετικά είδη μυκήτων με διαφορετικά προγράμματα θερμικών κυκλοποιητών).Και στις δύο περιπτώσεις, έγινε προσπάθεια εφαρμογής της νέα και πολλά υποσχόμενης προσέγγισης για την επεξήγηση των δεδομένων, γνωστή ως οπτική εξόρυξη δεδομένων, που προέκυψε από την τεχνολογική σύζευξη των αυτοματοποιημένων αλγορίθμων εξόρυξης δεδομένων και των τεχνικών οπτικοποίησης. Η αξιοποίηση τόσο των μεθόδων αυτόματης ανάλυσης όσο και της ανθρώπινης αντίληψης υπόσχεται πιο αποτελεσματική επιθεώρηση, κατανόηση και αλληλεπίδραση με τεράστιες συλλογές δεδομένων. In recent years, the increase and accumulation of biological data in international databases has been intense. The large number of registered nucleotides sequences (e.g. whole genomes, ESTs DNA and MRNA) and protein sequences, three-dimensional structures of biomacromolecular, as well as the mapping and sequencing of entire genomes, It has resulted in the concentration of a huge volume of crude data of extensive complexity. Researchers to respond to this challenge deemed it necessary to use computers for the efficient storage, organization, analysis and interpretation of this plethora of biological data. With the simultaneous intense development of informatics, the appropriate conditions were created for the development of a new and constantly evolving scientific field, bioinformatics.The purpose of this work is the development, application and study of tools, different technologies with main objectives, (a) the efficient organization of existing biological data and access to them as well as the accumulation of new data, (b) the Development of methods and computational tools for data visualization in order to extract information from data and (c) the use of these tools for the analysis and interpretation of data in a biologically acceptable way (Reichhardt, 1999).The first application was created using technology and tools developed and supported by Microsoft. This is RGDtrip, an application designed and implemented, for the purpose of storing, managing and processing protein data containing the tripeptide RGD. The research interest appeared from the first bibliographic review and evaluation of all RGD and loop sequences in receptors between species in 1998 and the verification that the occurrence of such sequences in receptors could mean that these The sequences would be in loop/loop-like structures and that these loop structures might entail a cell-adhesion function for receptors. This created an interesting hypothesis that RGD loops can add a cell adhesion function to the receptors. The need for phylogenetic and comparative functional research requires strong but intuitive and user-friendly massive comparison tests to achieve initial correlation results. As a result, there is an urgent need to represent the information in a visual format, allowing researchers to analyse the data and gain substantial knowledge, revealing the underlying models and possibly previous Invisible correlations between large datasets.The creation of the second application used free software tools and open source software (EL/LAC). The Fungibase application was created for the purpose of recording and storing the various digital repositories, which focused on characteristics of the micro-organism of interest (sequences, metabolic pathways, phenotype) and not on the underlying Methodological tissue. More specifically, the booming evolution of molecular (but also conventional) mycology in pharmaceutical research, in medical, pharmaceutical and biotechnological level, has created a chaos in access to the results of the corresponding research It has been massive, unregulated, fragmented and opportunistic.However, the original design of fungibase does not involve complex operations and complex processing or data mining. It includes incremental tools for searching and visualizing database data. It enables the researcher to seek information based on methodology, methodology fields and/or species of fungi, in order to check whether a technique has been applied to a particular fungus and what results it had, or what species has been applied method or parameter of method and the results, along with methodological deviations (eg PCR starters in different types of fungi with different programs of thermal cyclers).In both cases, an attempt was made to implement the new and promising approach for the explanation of data, known as optical data mining, resulting from the technological coupling of automated data mining algorithms and visualization techniques. The utilization of both automatic analysis methods and human perception promises more effective inspection, understanding and interaction with vast data collections. 2018-10-11T07:57:09Z 2018-10-11T07:57:09Z 2018-07-11 Thesis http://hdl.handle.net/10889/11660 gr Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. 0 application/pdf |