Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα

Στην πληροφορική, η έννοια της δομής δεδομένων αναφέρεται στους διαφορετικούς δυνατούς τρόπους οργάνωσης και αποθήκευσης δεδομένων μέσα σε έναν υπολογιστή, ώστε τα δεδομένα αυτά να μπορούν να χρησιμοποιηθούν αποδοτικά. Όταν αναφερόμαστε σε δεδομένα μεγάλου όγκου (big data), ξεφεύγουμε πλέον από τα ό...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Σουρλά, Ευφροσύνη
Άλλοι συγγραφείς: Τσακαλίδης, Αθανάσιος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2016
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/9090
id nemertes-10889-9090
record_format dspace
institution UPatras
collection Nemertes
language Greek
topic Δομές δεδομένων
Κατανεμημένα συστήματα
Εξισορρόπηση φορτίου
Ανοχή στα σφάλματα
Ιατρική πληροφορική
Εφαρμογές υγείας
Τηλειατρική
Διαδίκτυο των πραγμάτων
Data structures
Distributed systems
Load balancing
Fault tolerance
Medical informatics
Health applications
Telemedicine
Internet of things
005.7
spellingShingle Δομές δεδομένων
Κατανεμημένα συστήματα
Εξισορρόπηση φορτίου
Ανοχή στα σφάλματα
Ιατρική πληροφορική
Εφαρμογές υγείας
Τηλειατρική
Διαδίκτυο των πραγμάτων
Data structures
Distributed systems
Load balancing
Fault tolerance
Medical informatics
Health applications
Telemedicine
Internet of things
005.7
Σουρλά, Ευφροσύνη
Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
description Στην πληροφορική, η έννοια της δομής δεδομένων αναφέρεται στους διαφορετικούς δυνατούς τρόπους οργάνωσης και αποθήκευσης δεδομένων μέσα σε έναν υπολογιστή, ώστε τα δεδομένα αυτά να μπορούν να χρησιμοποιηθούν αποδοτικά. Όταν αναφερόμαστε σε δεδομένα μεγάλου όγκου (big data), ξεφεύγουμε πλέον από τα όρια ενός υπολογιστή και αναζητούμε τρόπους οργάνωσης, αποθήκευσης και διαχείρισής τους που να είναι ταυτόχρονα αποδοτικοί και μη δαπανηροί. Τα δεδομένα μεγάλου όγκου, όπως είναι τα ιατρικά και βιολογικά δεδομένα, αποτελούν τη βάση για την κατανόηση του βιολογικού κόσμου. Συλλέγονται από ποικίλες πηγές όπως κοινωνικά δίκτυα, αισθητήρες δικτύου, επιστημονικές εφαρμογές, διαδικτυακά κείμενα και έγγραφα κλπ. και διαθέτουν πολλά χαρακτηριστικά, συμπεριλαμβανομένων του μεγάλου μεγέθους, των ετερογενών δομών και της πολύπλοκης επεξεργασίας τους. Ο δημοφιλέστερος τρόπος διαχείρισης δεδομένων μεγάλου όγκου είναι τα κατανεμημένα συστήματα υπολογιστών. Ένα κατανεμημένο σύστημα μπορεί να οριστεί ως «ένα είδος αποκεντρωμένης και κατανεμημένης αρχιτεκτονικής δικτύου, στην οποία, ανεξάρτητοι κόμβοι λειτουργούν ταυτόχρονα ως πάροχοι και καταναλωτές πόρων, σε αντίθεση με τα κεντρικοποιημένα μοντέλα πελάτη-εξυπηρετητή στα οποία ο κόμβος-πελάτης ζητά πρόσβαση σε πόρους που παρέχονται από κεντρικούς εξυπηρετητές. Σε ένα κατανεμημένο δίκτυο, οι εργασίες (όπως αναζήτηση αρχείων ή ροή ήχου/εικόνας – audio/video streaming) διαμοιράζονται μεταξύ πολλαπλών διασυνδεδεμένων κόμβων, καθένας από τους οποίους προσφέρει ένα τμήμα των πόρων (επεξεργαστική ισχύ, χώρο αποθήκευσης, εύρος ζώνης δικτύου) σε άλλους κόμβους, χωρίς να μεσολαβεί κεντρικός συντονισμός από εξυπηρετητές». Τα κατανεμημένα δίκτυα, προκαλούν πλέον μεγάλο ενδιαφέρον στην παγκόσμια κοινότητα του κλάδου των δικτύων υπολογιστών και δικαίως θεωρούνται το μέλλον του διαδικτύου. Τυπικά παραδείγματα περιλαμβάνουν τα P2P (Peer-to-Peer) συστήματα, τα πολύ δημοφιλή πλέον υπολογιστικά περιβάλλοντα νέφους (cloud computing) και το ίδιο το διαδίκτυο. Ένα κατανεμημένο δίκτυο αναπαρίσταται από έναν γράφο, ένα λογικό δίκτυο επικάλυψης, οι κόμβοι του οποίου αντιστοιχούν στους δικτυακούς κόμβους, ενώ οι ακμές του δεν είναι απαραίτητο να αντιστοιχούν στους υπάρχοντες επικοινωνιακούς συνδέσμους, αλλά σε επικοινωνιακά μονοπάτια. Η πρόσφατη έρευνα έχει συνεισφέρει αξιοσημείωτα αποτελέσματα στην κατασκευή αποτελεσματικών αποκεντρωμένων συστημάτων με αποτελεσματική, κατανεμημένη αναζήτηση και λειτουργίες ενημέρωσης. Γενικά, τα κατανεμημένα συστήματα μπορούν να ταξινομηθούν σε δύο μεγάλες κατηγορίες: στα συστήματα βασισμένα σε πίνακες κατανεμημένου κατακερματισμού (Distributed Hash Table – DHT) και σε δενδρικά συστήματα. Εδώ εστιάζουμε στα ιεραρχικά δενδρικά δίκτυα επικάλυψης που υποστηρίζουν άμεσα αναζήτηση εύρους αλλά και πιο πολύπλοκα ερωτήματα. Συγκεκριμένα στο δεύτερο κεφάλαιο προτείνουμε μία πολλά υποσχόμενη δυναμική, ντετερμινιστική και αποκεντρωμένη δομή για κατανεμημένα δεδομένα, που ονομάζεται D3-Tree. Σ’ αυτό το κεφάλαιο, παρουσιάζεται εν συντομία η θεωρητική αλγοριθμική ανάλυση στην οποία βασίζεται η δομή αυτή και περιγράφονται πλήρως οι βασικές πτυχές της υλοποίησης και οι προκλήσεις που αντιμετωπίστηκαν στην προσπάθεια να μετατραπεί η θεωρητική αυτή δομή σ’ ένα ζωντανό παράδειγμα. Τα πειράματα επαληθεύουν ότι η υλοποιηθείσα δομή είναι αποδοτικότερη από άλλες γνωστές ιεραρχικές δενδρικές δομές, εφόσον παρέχει καλύτερες πολυπλοκότητες για τη δαπανηρή λειτουργία εξισορρόπησης φορτίου (load-balancing). Συγκεκριμένα, η δομή επιτυγχάνει κατανεμημένη πολυπλοκότητα O(logN) (όπου N ο αριθμός των κόμβων στο δίκτυο), χάρις σε ένα αποδοτικό ντετερμινιστικό μηχανισμό εξισορρόπησης φορτίου που είναι αρκετά γενικός ώστε να μπορεί να εφαρμοστεί και σε άλλες ιεραρχικές δεντρικές δομές. Επιπλέον, μελετάται η ανοχή της δομής σε σφάλματα, κάτι που δεν είχε εξεταστεί επαρκώς στον προκάτοχό της, όχι μόνο θεωρητικά, αλλά και μέσω πειραμάτων. Αποδεικνύεται ότι η προτεινόμενη δομή D3-Tree είναι ιδιαίτερα ανεκτική στα σφάλματα, αφού ακόμα και για μαζικές πτώσεις κόμβων επιτυγχάνει αξιοσημείωτα ποσοστά επιτυχών αναζητήσεων δεδομένων. Επιπλέον, επιτυγχάνει O(logN) κατανεμημένο κόστος αναζήτησης για μαζικές πτώσεις κόμβων. Στο τρίτο κεφάλαιο εστιάζουμε στα κατανεμημένα περιβάλλοντα μεγάλης κλίμακας, στα οποία η κλασσική λογαριθμική πολυπλοκότητα που προσφέρεται από τις υπάρχουσες λύσεις στη βιβλιογραφία, εξακολουθεί να είναι ακριβή για αναζητήσεις στοιχείων και ερωτήματα εύρους. Επίσης, οι διαθέσιμες λύσεις επιβαρύνονται με μεγάλα κόστη αναφορικά με άλλες κρίσιμες λειτουργίες όπως άφιξη/αναχώρηση κόμβων και εισαγωγή/διαγραφή δεδομένων. Στόχος είναι να παρέχουμε μια ολοκληρωμένη λύση που να ξεπερνά σε απόδοση τις υπάρχουσες λύσεις σ’ όλες τις βασικές λειτουργίες, όπως: αναζήτηση δεδομένων, άφιξη /αναχώρηση κόμβων, εισαγωγή/διαγραφή δεδομένων και εξισορρόπηση φορτίου, καθώς επίσης και στην απαιτούμενη πληροφορία δρομολόγησης που πρέπει να διατηρείται, ώστε να υποστηρίζονται οι παραπάνω λειτουργίες. Συγκεκριμένα, απώτερός μας στόχος είναι να επιτύχουμε υπο-λογαριθμική πολυπλοκότητα για όλες τις λειτουργίες που προαναφέρθηκαν. Στο συγκεκριμένο κεφάλαιο, συμβάλλουμε στην επίλυση του προβλήματος με τη δομή ART+ (Autonomous Range Tree), διάδοχο της δομής ART, ενσωματώνοντας την προτεινόμενη δομή D3-Tree στη δομή ART. Η ART+ επιτυγχάνει Ο((log_b(logN))^2) κόστος για αναζητήσεις και ενημερώσεις δεδομένων, όπου b είναι μια διπλά-εκθετική δύναμη του 2 και Ν είναι το συνολικό πλήθος των κόμβων. Επιπλέον, η δομή ART+ είναι μια πλήρως δυναμική και ανεκτική στα σφάλματα δομή, που υποστηρίζει τις λειτουργίες άφιξης/αναχώρησης κόμβων σε O(loglogN) αναμενόμενο με μεγάλη πιθανότητα πλήθος βημάτων και πραγματοποιεί εξισορρόπηση φορτίου με O(loglogN) κατανεμημένο κόστος. Η θεωρητική απόδοση επιβεβαιώνεται μέσω πειραμάτων που παρουσιάζονται στο κεφάλαιο αυτό. Στα πλαίσια του παρόντος ερευνητικού έργου, μελετήθηκαν επίσης έξυπνοι μηχανισμοί και αποδοτικές τεχνικές (μοντελοποίηση, διαχείριση, αρχιτεκτονική) για το σχεδιασμό εργαλείων και συστημάτων διαχείρισης ιατρικής πληροφορίας, που συμπεριλαμβάνονται στο γενικότερο ερευνητικό πεδίο της Ιατρικής Πληροφορικής (Medical Informatics). Στόχο του πεδίου αυτού αποτελεί η εξαγωγή, αποθήκευση και διαχείριση δεδομένων και πληροφοριών και η ανάπτυξη εργαλείων και πλατφορμών που μπορούν να εφαρμόσουν τη γνώση που θα παραχθεί σε διαδικασίες λήψης αποφάσεων. Η έλευση του Παγκόσμιου Ιστού έχει διευρύνει το πεδίο δράσης των Ιατρικών Πληροφοριακών Συστημάτων – ΙΠΣ οδηγώντας στην ανάπτυξη κατανεμημένων και διαλειτουργικών πηγών και υπηρεσιών πληροφορίας. Επιπρόσθετα, τα έξυπνα τηλέφωνα (smartphones) χρησιμοποιούνται πλέον ευρέως στον τομέα της υγείας. Δυο παραδείγματα που συνδυάζουν επιτυχώς τα ΙΠΣ με τα πλεονεκτήματα και τις δυνατότητες των έξυπνων τηλεφώνων είναι: (α) το ολοκληρωμένο σύστημα που αναπτύχθηκε για καταγραφή, παρακολούθηση και μελέτη ασθενών με Ανοικτά Κατάγματα Κνήμης, στην ειδικότητα της ορθοπεδικής και (β) το σύστημα καταγραφής αρτηριακής πίεσης στην ειδικότητα της καρδιολογίας. Και τα δυο συστήματα περιγράφονται συνοπτικά στο τέταρτο κεφάλαιο. Τον κύριο όγκο του τέταρτου κεφαλαίου καταλαμβάνει το CardioSmart365, ένα ολοκληρωμένο σύστημα για τη δια βίου παρακολούθηση ασθενών με καρδιολογικά προβλήματα, την έγκαιρη διάγνωση και τη βέλτιστη διαχείριση περιπτώσεων εκτάκτου ανάγκης. Το CardioSmart365 αποτελείται από διαδικτυακές εφαρμογές, διαδικτυακές υπηρεσίες και εφαρμογές για smartphones και σ' αυτό συμμετέχουν ασθενείς με καρδιολογικά προβλήματα, καρδιολόγοι και γενικοί ιατροί. Το σύστημα επιτρέπει την αλληλεπίδραση και την άμεση επικοινωνία ανάμεσα στα συνεργαζόμενα μέρη, καθώς επίσης και σε νοσοκομειακές μονάδες και εξω-νοσοκομειακούς φορείς. Τα βασικά χαρακτηριστικά του συστήματος είναι: (α) διαχείριση καταστάσεων εκτάκτου ανάγκης όπου ο ασθενής αποστέλλει στον καρδιολόγο το κύριο αίτιο και αυτός αξιολογεί την κατάσταση και προχωρά σε μια σειρά ενεργειών, (β) διαχείριση του ηλεκτρονικού φακέλου ασθενούς, (γ) καταγραφή μετρήσεων ζωτικών σημείων του ασθενούς στο σπίτι σε τακτική βάση και (δ) αλληλεπίδραση με την πλατφόρμα HealthVault της Microsoft. Η συνεισφορά του συστήματος έγκειται σε: (α) βέλτιστη παρακολούθηση ασθενών κατ' οίκον και έγκαιρη ανταπόκριση σε περιπτώσεις εκτάκτου ανάγκης, (β) βελτιωμένη επικοινωνία ανάμεσα στα συνεργαζόμενα μέρη και (γ) διατήρηση λεπτομερών αποθετηρίων ιατρικών δεδομένων, σε κοινή μορφοποίηση, για επιστημονική έρευνα. Στη συνέχεια του τέταρτου κεφαλαίου έγινε μια προσπάθεια μοντελοποίησης των πέντε πιο κοινών καρδιολογικών ασθενειών με τη βοήθεια της τεχνητής νοημοσύνης και σχεδιάστηκε και υλοποιήθηκε ένα έμπειρο σύστημα βασισμένο σε fuzzy λογική για την υποβοήθηση των καρδιολόγων και των γενικών ιατρών στη λήψη αποφάσεων. Οι πέντε ασθένειες είναι: στεφανιαία νόσος, υπέρταση, κολπική μαρμαρυγή, καρδιακή ανεπάρκεια και διαβήτης. Το υλοποιημένο σύστημα βελτιστοποιήθηκε στη συνέχεια με τη χρήση νευρωνικών δικτύων, σχεδιάζοντας και υλοποιώντας ένα προσαρμοστικό neuro-fuzzy σύστημα παραγωγής συμπερασμάτων (Adaptive Neuro-Fuzzy Inference System – ANFIS). Μ’ αυτόν τον τρόπο, επιτεύχθηκε ολοκλήρωση των εγγενών χαρακτηριστικών των νευρωνικών δικτύων (δυνατότητες μάθησης, παράλληλοι υπολογισμοί, ανοχή στα σφάλματα εισόδου) με αυτά των ασαφών συστημάτων (αναπαράσταση ανθρώπινης γνώσης, επεξηγηματική επάρκεια). Η μεθοδολογία που παρουσιάζεται στο πέμπτο κεφάλαιο, αναπτύχθηκε σε μια προσπάθεια να εκμεταλλευτούμε τις δυνατότητες που παρέχονται από το Διαδίκτυο των Πραγμάτων (Internet of Things - IoT) στον τομέα της υγείας. Πολλές υπηρεσίες που εισάγει το IoT διαθέτουν νοημοσύνη στις διαδικασίες τους, οδηγώντας μας πιο κοντά στο όραμα για το μέλλον του Διαδικτύου, όπου σχεδόν όλα τα αντικείμενα θα είναι web-enabled. Το πρόβλημα που αντιμετωπίζουμε εδώ είναι η ανάγκη για μια μεθοδολογία που θα βοηθήσει το χρήστη να επιλέξει το βέλτιστο συνδυασμό της μορφοποίησης των δεδομένων και του τρόπου μετάδοσής τους, ώστε να οδηγηθεί σε μείωση του χρηματικού κόστους μετάδοσης αυτών. Πιο συγκεκριμένα, προσπαθούμε να μετρήσουμε τις επιδόσεις ενός δικτύου συνδεδεμένων συσκευών που επικοινωνούν με άλλες εφαρμογές και ανταλλάσσουν ιατρικά δεδομένα. Απώτερος στόχος είναι η ανάπτυξη μιας έξυπνης εφαρμογής που να μας επιτρέπει να ορίσουμε τα δεδομένα που πρέπει να καταγραφούν και τη συχνότητα καταγραφής τους και θα χρησιμοποιεί αυτές τις πληροφορίες για να προτείνει την καταλληλότερη τεχνολογία μετάδοσης δεδομένων, ανάλογα με τον όγκο και τη μορφοποίησή τους. Πρέπει να ληφθεί υπόψη ότι μέχρι στιγμής κανείς δεν έχει προσεγγίσει το ζήτημα από τη σκοπιά της χρήσης internet και του κόστους που αυτή συνεπάγεται. Στο κεφάλαιο αυτό παρουσιάζεται η μεθοδολογία, οι μετρικές που εισήχθησαν και τα πειράματα που πραγματοποιήσαμε για την αξιολόγηση της πρότασής μας.
author2 Τσακαλίδης, Αθανάσιος
author_facet Τσακαλίδης, Αθανάσιος
Σουρλά, Ευφροσύνη
format Thesis
author Σουρλά, Ευφροσύνη
author_sort Σουρλά, Ευφροσύνη
title Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
title_short Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
title_full Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
title_fullStr Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
title_full_unstemmed Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
title_sort αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα
publishDate 2016
url http://hdl.handle.net/10889/9090
work_keys_str_mv AT sourlaeuphrosynē apodotikoialgorithmoidiacheirisēsmegalouonkoudedomenōnkaiapotelesmatikestechnikesschediasmousystēmatōnmeepharmogēseiatrikadedomena
AT sourlaeuphrosynē efficientalgorithmsforlargevolumedatamanagementandeffectivesystemdesigntechniquesapplicabletomedicaldata
_version_ 1771297347533275136
spelling nemertes-10889-90902022-09-05T20:27:53Z Αποδοτικοί αλγόριθμοι διαχείρισης μεγάλου όγκου δεδομένων και αποτελεσματικές τεχνικές σχεδιασμού συστημάτων με εφαρμογή σε ιατρικά δεδομένα Efficient algorithms for large volume data management and effective system design techniques applicable to medical data Σουρλά, Ευφροσύνη Τσακαλίδης, Αθανάσιος Τσακαλίδης, Αθανάσιος Μακρής, Χρήστος Τζήμας, Ιωάννης Χατζηλυγερούδης, Ιωάννης Σιούτας, Σπύρος Τσίχλας, Κωνσταντίνος Πουλάς, Κωνσταντίνος Sourla, Efrosini Δομές δεδομένων Κατανεμημένα συστήματα Εξισορρόπηση φορτίου Ανοχή στα σφάλματα Ιατρική πληροφορική Εφαρμογές υγείας Τηλειατρική Διαδίκτυο των πραγμάτων Data structures Distributed systems Load balancing Fault tolerance Medical informatics Health applications Telemedicine Internet of things 005.7 Στην πληροφορική, η έννοια της δομής δεδομένων αναφέρεται στους διαφορετικούς δυνατούς τρόπους οργάνωσης και αποθήκευσης δεδομένων μέσα σε έναν υπολογιστή, ώστε τα δεδομένα αυτά να μπορούν να χρησιμοποιηθούν αποδοτικά. Όταν αναφερόμαστε σε δεδομένα μεγάλου όγκου (big data), ξεφεύγουμε πλέον από τα όρια ενός υπολογιστή και αναζητούμε τρόπους οργάνωσης, αποθήκευσης και διαχείρισής τους που να είναι ταυτόχρονα αποδοτικοί και μη δαπανηροί. Τα δεδομένα μεγάλου όγκου, όπως είναι τα ιατρικά και βιολογικά δεδομένα, αποτελούν τη βάση για την κατανόηση του βιολογικού κόσμου. Συλλέγονται από ποικίλες πηγές όπως κοινωνικά δίκτυα, αισθητήρες δικτύου, επιστημονικές εφαρμογές, διαδικτυακά κείμενα και έγγραφα κλπ. και διαθέτουν πολλά χαρακτηριστικά, συμπεριλαμβανομένων του μεγάλου μεγέθους, των ετερογενών δομών και της πολύπλοκης επεξεργασίας τους. Ο δημοφιλέστερος τρόπος διαχείρισης δεδομένων μεγάλου όγκου είναι τα κατανεμημένα συστήματα υπολογιστών. Ένα κατανεμημένο σύστημα μπορεί να οριστεί ως «ένα είδος αποκεντρωμένης και κατανεμημένης αρχιτεκτονικής δικτύου, στην οποία, ανεξάρτητοι κόμβοι λειτουργούν ταυτόχρονα ως πάροχοι και καταναλωτές πόρων, σε αντίθεση με τα κεντρικοποιημένα μοντέλα πελάτη-εξυπηρετητή στα οποία ο κόμβος-πελάτης ζητά πρόσβαση σε πόρους που παρέχονται από κεντρικούς εξυπηρετητές. Σε ένα κατανεμημένο δίκτυο, οι εργασίες (όπως αναζήτηση αρχείων ή ροή ήχου/εικόνας – audio/video streaming) διαμοιράζονται μεταξύ πολλαπλών διασυνδεδεμένων κόμβων, καθένας από τους οποίους προσφέρει ένα τμήμα των πόρων (επεξεργαστική ισχύ, χώρο αποθήκευσης, εύρος ζώνης δικτύου) σε άλλους κόμβους, χωρίς να μεσολαβεί κεντρικός συντονισμός από εξυπηρετητές». Τα κατανεμημένα δίκτυα, προκαλούν πλέον μεγάλο ενδιαφέρον στην παγκόσμια κοινότητα του κλάδου των δικτύων υπολογιστών και δικαίως θεωρούνται το μέλλον του διαδικτύου. Τυπικά παραδείγματα περιλαμβάνουν τα P2P (Peer-to-Peer) συστήματα, τα πολύ δημοφιλή πλέον υπολογιστικά περιβάλλοντα νέφους (cloud computing) και το ίδιο το διαδίκτυο. Ένα κατανεμημένο δίκτυο αναπαρίσταται από έναν γράφο, ένα λογικό δίκτυο επικάλυψης, οι κόμβοι του οποίου αντιστοιχούν στους δικτυακούς κόμβους, ενώ οι ακμές του δεν είναι απαραίτητο να αντιστοιχούν στους υπάρχοντες επικοινωνιακούς συνδέσμους, αλλά σε επικοινωνιακά μονοπάτια. Η πρόσφατη έρευνα έχει συνεισφέρει αξιοσημείωτα αποτελέσματα στην κατασκευή αποτελεσματικών αποκεντρωμένων συστημάτων με αποτελεσματική, κατανεμημένη αναζήτηση και λειτουργίες ενημέρωσης. Γενικά, τα κατανεμημένα συστήματα μπορούν να ταξινομηθούν σε δύο μεγάλες κατηγορίες: στα συστήματα βασισμένα σε πίνακες κατανεμημένου κατακερματισμού (Distributed Hash Table – DHT) και σε δενδρικά συστήματα. Εδώ εστιάζουμε στα ιεραρχικά δενδρικά δίκτυα επικάλυψης που υποστηρίζουν άμεσα αναζήτηση εύρους αλλά και πιο πολύπλοκα ερωτήματα. Συγκεκριμένα στο δεύτερο κεφάλαιο προτείνουμε μία πολλά υποσχόμενη δυναμική, ντετερμινιστική και αποκεντρωμένη δομή για κατανεμημένα δεδομένα, που ονομάζεται D3-Tree. Σ’ αυτό το κεφάλαιο, παρουσιάζεται εν συντομία η θεωρητική αλγοριθμική ανάλυση στην οποία βασίζεται η δομή αυτή και περιγράφονται πλήρως οι βασικές πτυχές της υλοποίησης και οι προκλήσεις που αντιμετωπίστηκαν στην προσπάθεια να μετατραπεί η θεωρητική αυτή δομή σ’ ένα ζωντανό παράδειγμα. Τα πειράματα επαληθεύουν ότι η υλοποιηθείσα δομή είναι αποδοτικότερη από άλλες γνωστές ιεραρχικές δενδρικές δομές, εφόσον παρέχει καλύτερες πολυπλοκότητες για τη δαπανηρή λειτουργία εξισορρόπησης φορτίου (load-balancing). Συγκεκριμένα, η δομή επιτυγχάνει κατανεμημένη πολυπλοκότητα O(logN) (όπου N ο αριθμός των κόμβων στο δίκτυο), χάρις σε ένα αποδοτικό ντετερμινιστικό μηχανισμό εξισορρόπησης φορτίου που είναι αρκετά γενικός ώστε να μπορεί να εφαρμοστεί και σε άλλες ιεραρχικές δεντρικές δομές. Επιπλέον, μελετάται η ανοχή της δομής σε σφάλματα, κάτι που δεν είχε εξεταστεί επαρκώς στον προκάτοχό της, όχι μόνο θεωρητικά, αλλά και μέσω πειραμάτων. Αποδεικνύεται ότι η προτεινόμενη δομή D3-Tree είναι ιδιαίτερα ανεκτική στα σφάλματα, αφού ακόμα και για μαζικές πτώσεις κόμβων επιτυγχάνει αξιοσημείωτα ποσοστά επιτυχών αναζητήσεων δεδομένων. Επιπλέον, επιτυγχάνει O(logN) κατανεμημένο κόστος αναζήτησης για μαζικές πτώσεις κόμβων. Στο τρίτο κεφάλαιο εστιάζουμε στα κατανεμημένα περιβάλλοντα μεγάλης κλίμακας, στα οποία η κλασσική λογαριθμική πολυπλοκότητα που προσφέρεται από τις υπάρχουσες λύσεις στη βιβλιογραφία, εξακολουθεί να είναι ακριβή για αναζητήσεις στοιχείων και ερωτήματα εύρους. Επίσης, οι διαθέσιμες λύσεις επιβαρύνονται με μεγάλα κόστη αναφορικά με άλλες κρίσιμες λειτουργίες όπως άφιξη/αναχώρηση κόμβων και εισαγωγή/διαγραφή δεδομένων. Στόχος είναι να παρέχουμε μια ολοκληρωμένη λύση που να ξεπερνά σε απόδοση τις υπάρχουσες λύσεις σ’ όλες τις βασικές λειτουργίες, όπως: αναζήτηση δεδομένων, άφιξη /αναχώρηση κόμβων, εισαγωγή/διαγραφή δεδομένων και εξισορρόπηση φορτίου, καθώς επίσης και στην απαιτούμενη πληροφορία δρομολόγησης που πρέπει να διατηρείται, ώστε να υποστηρίζονται οι παραπάνω λειτουργίες. Συγκεκριμένα, απώτερός μας στόχος είναι να επιτύχουμε υπο-λογαριθμική πολυπλοκότητα για όλες τις λειτουργίες που προαναφέρθηκαν. Στο συγκεκριμένο κεφάλαιο, συμβάλλουμε στην επίλυση του προβλήματος με τη δομή ART+ (Autonomous Range Tree), διάδοχο της δομής ART, ενσωματώνοντας την προτεινόμενη δομή D3-Tree στη δομή ART. Η ART+ επιτυγχάνει Ο((log_b(logN))^2) κόστος για αναζητήσεις και ενημερώσεις δεδομένων, όπου b είναι μια διπλά-εκθετική δύναμη του 2 και Ν είναι το συνολικό πλήθος των κόμβων. Επιπλέον, η δομή ART+ είναι μια πλήρως δυναμική και ανεκτική στα σφάλματα δομή, που υποστηρίζει τις λειτουργίες άφιξης/αναχώρησης κόμβων σε O(loglogN) αναμενόμενο με μεγάλη πιθανότητα πλήθος βημάτων και πραγματοποιεί εξισορρόπηση φορτίου με O(loglogN) κατανεμημένο κόστος. Η θεωρητική απόδοση επιβεβαιώνεται μέσω πειραμάτων που παρουσιάζονται στο κεφάλαιο αυτό. Στα πλαίσια του παρόντος ερευνητικού έργου, μελετήθηκαν επίσης έξυπνοι μηχανισμοί και αποδοτικές τεχνικές (μοντελοποίηση, διαχείριση, αρχιτεκτονική) για το σχεδιασμό εργαλείων και συστημάτων διαχείρισης ιατρικής πληροφορίας, που συμπεριλαμβάνονται στο γενικότερο ερευνητικό πεδίο της Ιατρικής Πληροφορικής (Medical Informatics). Στόχο του πεδίου αυτού αποτελεί η εξαγωγή, αποθήκευση και διαχείριση δεδομένων και πληροφοριών και η ανάπτυξη εργαλείων και πλατφορμών που μπορούν να εφαρμόσουν τη γνώση που θα παραχθεί σε διαδικασίες λήψης αποφάσεων. Η έλευση του Παγκόσμιου Ιστού έχει διευρύνει το πεδίο δράσης των Ιατρικών Πληροφοριακών Συστημάτων – ΙΠΣ οδηγώντας στην ανάπτυξη κατανεμημένων και διαλειτουργικών πηγών και υπηρεσιών πληροφορίας. Επιπρόσθετα, τα έξυπνα τηλέφωνα (smartphones) χρησιμοποιούνται πλέον ευρέως στον τομέα της υγείας. Δυο παραδείγματα που συνδυάζουν επιτυχώς τα ΙΠΣ με τα πλεονεκτήματα και τις δυνατότητες των έξυπνων τηλεφώνων είναι: (α) το ολοκληρωμένο σύστημα που αναπτύχθηκε για καταγραφή, παρακολούθηση και μελέτη ασθενών με Ανοικτά Κατάγματα Κνήμης, στην ειδικότητα της ορθοπεδικής και (β) το σύστημα καταγραφής αρτηριακής πίεσης στην ειδικότητα της καρδιολογίας. Και τα δυο συστήματα περιγράφονται συνοπτικά στο τέταρτο κεφάλαιο. Τον κύριο όγκο του τέταρτου κεφαλαίου καταλαμβάνει το CardioSmart365, ένα ολοκληρωμένο σύστημα για τη δια βίου παρακολούθηση ασθενών με καρδιολογικά προβλήματα, την έγκαιρη διάγνωση και τη βέλτιστη διαχείριση περιπτώσεων εκτάκτου ανάγκης. Το CardioSmart365 αποτελείται από διαδικτυακές εφαρμογές, διαδικτυακές υπηρεσίες και εφαρμογές για smartphones και σ' αυτό συμμετέχουν ασθενείς με καρδιολογικά προβλήματα, καρδιολόγοι και γενικοί ιατροί. Το σύστημα επιτρέπει την αλληλεπίδραση και την άμεση επικοινωνία ανάμεσα στα συνεργαζόμενα μέρη, καθώς επίσης και σε νοσοκομειακές μονάδες και εξω-νοσοκομειακούς φορείς. Τα βασικά χαρακτηριστικά του συστήματος είναι: (α) διαχείριση καταστάσεων εκτάκτου ανάγκης όπου ο ασθενής αποστέλλει στον καρδιολόγο το κύριο αίτιο και αυτός αξιολογεί την κατάσταση και προχωρά σε μια σειρά ενεργειών, (β) διαχείριση του ηλεκτρονικού φακέλου ασθενούς, (γ) καταγραφή μετρήσεων ζωτικών σημείων του ασθενούς στο σπίτι σε τακτική βάση και (δ) αλληλεπίδραση με την πλατφόρμα HealthVault της Microsoft. Η συνεισφορά του συστήματος έγκειται σε: (α) βέλτιστη παρακολούθηση ασθενών κατ' οίκον και έγκαιρη ανταπόκριση σε περιπτώσεις εκτάκτου ανάγκης, (β) βελτιωμένη επικοινωνία ανάμεσα στα συνεργαζόμενα μέρη και (γ) διατήρηση λεπτομερών αποθετηρίων ιατρικών δεδομένων, σε κοινή μορφοποίηση, για επιστημονική έρευνα. Στη συνέχεια του τέταρτου κεφαλαίου έγινε μια προσπάθεια μοντελοποίησης των πέντε πιο κοινών καρδιολογικών ασθενειών με τη βοήθεια της τεχνητής νοημοσύνης και σχεδιάστηκε και υλοποιήθηκε ένα έμπειρο σύστημα βασισμένο σε fuzzy λογική για την υποβοήθηση των καρδιολόγων και των γενικών ιατρών στη λήψη αποφάσεων. Οι πέντε ασθένειες είναι: στεφανιαία νόσος, υπέρταση, κολπική μαρμαρυγή, καρδιακή ανεπάρκεια και διαβήτης. Το υλοποιημένο σύστημα βελτιστοποιήθηκε στη συνέχεια με τη χρήση νευρωνικών δικτύων, σχεδιάζοντας και υλοποιώντας ένα προσαρμοστικό neuro-fuzzy σύστημα παραγωγής συμπερασμάτων (Adaptive Neuro-Fuzzy Inference System – ANFIS). Μ’ αυτόν τον τρόπο, επιτεύχθηκε ολοκλήρωση των εγγενών χαρακτηριστικών των νευρωνικών δικτύων (δυνατότητες μάθησης, παράλληλοι υπολογισμοί, ανοχή στα σφάλματα εισόδου) με αυτά των ασαφών συστημάτων (αναπαράσταση ανθρώπινης γνώσης, επεξηγηματική επάρκεια). Η μεθοδολογία που παρουσιάζεται στο πέμπτο κεφάλαιο, αναπτύχθηκε σε μια προσπάθεια να εκμεταλλευτούμε τις δυνατότητες που παρέχονται από το Διαδίκτυο των Πραγμάτων (Internet of Things - IoT) στον τομέα της υγείας. Πολλές υπηρεσίες που εισάγει το IoT διαθέτουν νοημοσύνη στις διαδικασίες τους, οδηγώντας μας πιο κοντά στο όραμα για το μέλλον του Διαδικτύου, όπου σχεδόν όλα τα αντικείμενα θα είναι web-enabled. Το πρόβλημα που αντιμετωπίζουμε εδώ είναι η ανάγκη για μια μεθοδολογία που θα βοηθήσει το χρήστη να επιλέξει το βέλτιστο συνδυασμό της μορφοποίησης των δεδομένων και του τρόπου μετάδοσής τους, ώστε να οδηγηθεί σε μείωση του χρηματικού κόστους μετάδοσης αυτών. Πιο συγκεκριμένα, προσπαθούμε να μετρήσουμε τις επιδόσεις ενός δικτύου συνδεδεμένων συσκευών που επικοινωνούν με άλλες εφαρμογές και ανταλλάσσουν ιατρικά δεδομένα. Απώτερος στόχος είναι η ανάπτυξη μιας έξυπνης εφαρμογής που να μας επιτρέπει να ορίσουμε τα δεδομένα που πρέπει να καταγραφούν και τη συχνότητα καταγραφής τους και θα χρησιμοποιεί αυτές τις πληροφορίες για να προτείνει την καταλληλότερη τεχνολογία μετάδοσης δεδομένων, ανάλογα με τον όγκο και τη μορφοποίησή τους. Πρέπει να ληφθεί υπόψη ότι μέχρι στιγμής κανείς δεν έχει προσεγγίσει το ζήτημα από τη σκοπιά της χρήσης internet και του κόστους που αυτή συνεπάγεται. Στο κεφάλαιο αυτό παρουσιάζεται η μεθοδολογία, οι μετρικές που εισήχθησαν και τα πειράματα που πραγματοποιήσαμε για την αξιολόγηση της πρότασής μας. In computer science, a data structure is a particular way of organizing data in a computer so that it can be used efficiently. Different kinds of data structures are suited to different kinds of applications, and some are highly specialized to specific tasks. When referring to big data, we get away from the limits of a single computer and look for ways to organize, store and manage them, which are both efficient and cost effective. Big data, such as medical and biological data, are the basis for the understanding of the biological world. They are collected from a variety of sources such as social networks, network sensors, scientific applications, online texts and documents etc. and are characterized by large volumes, heterogeneous structures and complex processing. Decentralized systems consist the most popular way of big data management. A decentralized system "is a type of distributed network architecture, in which, individual nodes in the network act as both suppliers and consumers of resources, in contrast to centralized client-server model where client nodes request access to resources provided by central servers. In a decentralized network, tasks (such as searching for files or streaming audio/video) are shared amongst multiple interconnected nodes, who each make a portion of their resources (such as processing power, disk storage or network bandwidth) directly available to other network participants, without the need for centralized coordination by servers. Decentralized systems have become very popular nowadays and are promoted as the future of Internet networking. Typical examples include P2P (peer-to-peer) systems, Cloud Computing environments and the Internet. A decentralized network is represented by a graph, a logical overlay network, where its nodes correspond to the network nodes, while its edges may not correspond to existing communication links, but to communication paths. Considerable work has been done recently in order to build efficient decentralized systems with effective distributed search and update operations. In general, decentralized networks can be classified into two broad categories: distributed hash table (DHT)-based systems and tree-based systems. In this work, we focus on hierarchical tree-based overlay networks that support directly range and more complex queries. More specifically, in Chapter 2, we propose D3-Tree, a dynamic distributed deterministic structure for data management in decentralized networks. We present in brief the theoretical algorithmic analysis, in which our proposed structure is based on, and we describe thoroughly the key aspects of the implementation. Conducting experiments, we verify that the implemented structure outperforms other well-known hierarchical tree-based structures, since it provides better complexities regarding load-balancing operations. More specifically, the structure achieves an O(logN) amortized bound (N is the number of nodes present in the network), using an efficient deterministic load-balancing mechanism, which is general enough to be applied to other hierarchical tree-based structures. Moreover, we investigate the structure's fault tolerance, which hasn't been sufficiently tackled in previous work, both theoretically and through rigorous experimentation. We prove that D3-Tree is highly fault tolerant, since, even for massive node failures, it achieves a significant success rate in element queries. Moreover, it achieves O(logN) amortized search cost under massive node failures. In chapter 3, we focus on large scale decentralized environments, in which the classic logarithmic complexity offered by solutions in literature, is still too expensive for single and range queries. Further, all available solutions incur large overheads with respect to other critical operations, such as join/leave of nodes, and insertion/deletion of items. Our aim in this work is to provide a solution that is comprehensive and outperforms related work with respect to all major operations, such as search, join/leave, insert/delete and load-balancing and to the required routing state that must be maintained in order to support these operations. In particular, our ultimate goal is to achieve a sub-logarithmic complexity for all the above operations. We contribute the ART+ structure, which outperforms the most popular decentralized structures, integrating D3-Tree with the ART (Autonomous Range Tree) structure. ART+ achieves O((log_b(logN))^2) communication cost for query and update operations, where b is a double-exponentially power of two and N is the total number of nodes. Moreover, ART+ is a fully dynamic and fault-tolerant structure, which supports the join/leave node operations in O(loglogN) expected w.h.p number of hops and performs load-balancing in O(loglogN) amortized cost. The theoretical performace is verified through experiments. In this research work, we also studied efficient mechanisms and effective techniques (modeling, management, architecture) to design tools and systems for medical information management, which are included on the research area of Medical Informatics. The objective of this field is the extraction, storage and manipulation of data and information and the development of tools and platforms that apply knowledge in the decision-making process. The advent of internet has broaden the scope of Medical Information Systems (MISs) and led to the development of distributed and interoperable information sources and services. Two examples which successfully combine MISs with the advantages and capabilities of Smartphones, are (a) the integrated system that was developed for recording, monitoring and studying patients with Open Tibia Fractures, in Orthopaedics and (b) the blood pressure recording system, in Cardiology. Both systems are briefly described in Chapter 4. Chapter 4 is mainly dedicated to CardioSmart365, an integrated system for lifelong cardiologic patient monitoring, early detection and optimal management of emergency cases. CardioSmart365 consists of web applications, web services and smart phone applications. The system involves the participation of cardiologic patients, cardiologists and general practitioners and allows interaction and instant communication between the corresponding parties, as well as Hospitals and out-Hospital health sectors. The key features of the proposed system are: (a) management of emergency cases where the patient sends a chief complaint and the cardiologist evaluates the situation and proceeds to a series of actions, (b) management of patients' EMRs, (c) recording of patients' measurements of vital signs performed at home in regular basis and (d) interconnection to Microsoft HealthVault platform. Our system’s contribution lies in: (a) optimal patient monitoring at home and early response in cases of emergency, (b) enhanced communication between collaborating parties and (c) maintenance of detailed medical data repositories, in common format, for scientific research. Subsequently Chapter 4 describes an attempt of modeling the five most common cardiovascular diseases using artificial intelligence tools. The expert system which was designed and implemented is based on fuzzy logic, in order to help cardiologists and general practitioners in decision making. The five diseases are: coronary heart disease, hypertension, atrial fibrillation, heart failure and diabetes. The implemented system was then optimized using neural networks, designing and implementing an adaptive neuro-fuzzy inference system (ANFIS). In this way, they reached completion of the intrinsic properties of neural networks (learning opportunities, parallel calculations, tolerance input errors) with those of fuzzy systems (representation of human knowledge, explanatory adequacy). Thus, the inherent characteristics of ANNs (learning abilities, parallel computation, and faulty input tolerance), along with those of fuzzy expert systems (human-like knowledge representation and explanation proficiency) were integrated. The methodology presented in Chapter 5, was developed in an attempt to exploit the capabilities of Internet of Things (IoT) in the Health domain. Many services introduced by the IoT have intelligence in their processes, leading us closer to the vision for the future of the Internet, where almost all objects will be web-enabled. The problem we face here is the need for a methodology that will help the user to select the optimum combination of data formatting and transmission mode, in order to minimize the transmission monetary cost. In particular, we try to measure the performance of a network of connected devices that communicate with other applications and exchange medical data. The ultimate goal is to develop an intelligent application that allows us to define the data to be recorded and the recording frequencies and will use this information to propose the most appropriate data transmission technology, depending on the volume and formatting of data. It should be noted that so far no one has approached the issue from the perspective of the use of internet and the costs it entails. This chapter presents the methodology, the introduced metrics and the experiments we conducted to evaluate our proposal. 2016-01-20T10:42:33Z 2016-01-20T10:42:33Z 2015-06-30 Thesis http://hdl.handle.net/10889/9090 gr Η ΒΚΠ διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή στο βιβλιοστάσιο διδακτορικών διατριβών που βρίσκεται στο ισόγειο του κτιρίου της. 6 application/pdf