Deep learning για βιολογικά δεδομένα μεγάλης κλίμακας : επεξεργασία βιολογικών ακολουθιών με συνελικτικά νευρωνικά δίκτυα

Οι σύγχρονες εργαστηριακές μέθοδοι παράγουν τεράστιες ποσότητες πειραματικών βιολογικών δεδομένων, σε μορφή βιολογικών ακολουθιών. Η επεξεργασία αυτών των δεδομένων είναι απαιτητική εξαιτίας του μεγάλου όγκου και της πολυπλοκότητάς τους. Η ανάπτυξη νέων εργαλείων ανάλυσης και επεξεργασίας είναι επιτ...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος συγγραφέας: Ντόκος, Γεώργιος
Άλλοι συγγραφείς: Μακρής, Χρήστος
Μορφή: Thesis
Γλώσσα:Greek
Έκδοση: 2019
Θέματα:
Διαθέσιμο Online:http://hdl.handle.net/10889/12448
Περιγραφή
Περίληψη:Οι σύγχρονες εργαστηριακές μέθοδοι παράγουν τεράστιες ποσότητες πειραματικών βιολογικών δεδομένων, σε μορφή βιολογικών ακολουθιών. Η επεξεργασία αυτών των δεδομένων είναι απαιτητική εξαιτίας του μεγάλου όγκου και της πολυπλοκότητάς τους. Η ανάπτυξη νέων εργαλείων ανάλυσης και επεξεργασίας είναι επιτακτική ανάγκη. Από την πλευρά της Πληροφορικής, αναπτύσσονται όλο και ισχυρότερα υπολογιστικά εργαλεία που δίνουν τη δυνατότητα διαχείρησης τέτοιου τύπου δεδομένων. Μας απασχολούν οι μέθοδοι που εντάσσονται στο πεδίο της Μηχανικής Μάθησης και ιδιαίτερα στο Deep Learning. Οι πολυεπίπεδες αρχιτεκτονικές χρησιμοποιούνται ήδη με μεγάλη επιτυχία σε αρκετές εφαρμογές, κυρίως σχετικές με επεξεργασία εικόνας. Οι επιδόσεις τους αποτελούν κίνητρο για να εξερευνήσουμε την αποτελεσματικότητά τους σε εφαρμογές Βιοπληροφορικής που σχετίζονται με δεδομένα σε μορφή ακολουθιών (DNA, RNA, πρωτεϊνες). Στο πρώτο κομμάτι της εργασίας παρουσιάζονται οι σημαντικότερες μεθοδολογίες και περιγράφονται σχετικές εργασίες που χρησιμοποιούν μοντέλα πολυεπίπεδων νευρωνικών δικτύων για επεξεργασία ακολουθιών. Στο δεύτερο κομμάτι της εργασίας επιχειρείται η υλοποίηση ενός τέτοιου μοντέλου με σκοπό την επιβεβαίωση ότι αυτές οι τεχνικές είναι αποτελεσματικότερες από τις συμβατικές μεθόδους, τουλάχιστον όσον αφορά την κατηγοριοποίηση βιολογικών ακολουθιών. Πιο συγκεκριμένα, περιγράφεται η μεθοδολογία για την δημιουργία και εκπαίδευση ενός μοντέλου Συνελικτικών Νευρωνικών Δικτύων που εκτελεί κατηγοριοποίηση ακολουθιών DNA που μπορεί να περιέχουν enhancers (μικρές ακολουθίες που ενισχύουν τη διαδικασία της μεταγραφής του DNA). Παρουσιάζεται βήμα προς βήμα η προεπεξεργασία των δεδομένων, η κατασκευή και εκπαίδευση των νευρωνικών δικτύων, καθώς και όλες οι επιλογές που έγιναν για να βρεθεί η βέλτιστη δομή. Κλείνοντας, γίνεται μια συζήτηση σχετικά με θέματα που απασχολούν ή αναμένεται να απασχολήσουν την έρευνα στον τομέα των συνελικτικών δικτύων, όπως η έλλειψη επαρκούς θεωρητικής κατανόησης και η επιλογή της κατάλληλης αρχιτεκτονικής.