A Deep Reinforcement Learning Neural Network Folding Proteins

Διπλωματική Εργασία uoadl:2884734 271 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοπληροφορική
Πληροφορική
Ημερομηνία κατάθεσης:
2020-10-20
Έτος εκπόνησης:
2020
Συγγραφέας:
Πάνου Δήμητρα
Στοιχεία επιβλεπόντων καθηγητών:
Martin Reczko, Ειδικός Λειτουργικός Επιστήμονας Α' Ερευνητικού Κέντρου Βιοϊατρικών Επιστημών 'Αλέξανδρος Φλέμινγκ'
Ηλίας Μανωλάκος, Καθηγητής του τμήματος ΠΛηροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
A Deep Reinforcement Learning Neural Network Folding Proteins
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Νευρωνικό δίκτυο βαθιάς ενισχυτικής μάθησης για την αναδίπλωση πρωτεϊνών
Περίληψη:
Παρά τη σημαντική πρόοδο, η πρόβλεψη δομής πρωτεϊνών από την "εξ αρχής" πρωτεϊνική ακολουθία (ab initio) παραμένει ένα άλυτο πρόβλημα. Μια καλή προσέγγιση αποτελεί το ηλεκτρονικό παιχνίδι παζλ Foldit [1], το οποίο παρείχε στην επιστημονική κοινότητα αρκετά χρήσιμα αποτελέσματα, αντίστοιχα ή ακόμα και καλύτερα από τις μέχρι τώρα υπολογιστικές λύσεις [2]. Χρησιμοποιώντας το Foldit, το κοινό του WeFold [3] είχε αρκετές επιτυχημένες συμμετοχές στην κριτική αξιολόγηση τεχνικών πρόβλεψης δομής των πρωτεϊνών. Βασιζόμενοι στην πρόσφατη έκδοση του Foldit, Folditstandalone [4], εκπαιδεύσαμε ένα νευρωνικό δίκτυο βαθιάς ενισχυτικής μάθησης, το DeepFoldit, για να βελτιώσει τη βαθμολογία που δίνεται σε μια ξεδιπλωμένη πρωτεΐνη, χρησιμοποιώντας τη μέθοδο Q-learning [5] με επανάληψη εμπειρίας (experience replay). Η παρούσα διπλωματική εργασία επικεντρώνεται στη βελτίωση του μοντέλου πρόβλεψης μέσω της ρύθμισης υπερπαραμέτρων. Εξετάσαμε διάφορες υλοποιήσεις, χρησιμοποιώντας διαφορετικές αρχιτεκτονικές μοντέλων και μεταβάλλοντας τις τιμές των υπερπαραμέτρων. Καταλήξαμε σε ένα μοντέλο που επιτυγχάνει καλύτερη ακρίβεια από την αρχική υλοποίηση. Ενισχύθηκε έτσι η απόδοση με το νέο μοντέλο και βελτιώθηκε η ικανότητά του για γενίκευση. Τα αρχικά αποτελέσματα δείχνουν ότι, δεδομένης μιας σειράς μικρών ξετυλιγμένων ευθύγραμμων πρωτεϊνικών μορίων για εκπαίδευση, το DeepFoldit μαθαίνει γρήγορα τις ακολουθίες δράσης που βελτιώνουν τη βαθμολογία τόσο στα δεδομένα που χρησιμοποιήθηκαν στη διαδικασία εκπαίδευσης (training set), όσο και στις νέες δοκιμαστικές πρωτεΐνες (test set). Αυτό είναι σημαντικό καθώς η βελτίωση της βαθμολογίας του παιχνιδιού σημαίνει την επίτευξη μιας καλύτερης αναδίπλωσης, το οποίο μας φέρνει ένα βήμα πιο κοντά στην λύση. Η προσέγγισή μας συνδυάζει την έξυπνη διεπαφή του Foldit με τη δύναμη της βαθιάς ενισχυτικής μάθησης.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Πρόβλεψη τρισδιάστατης δομής πρωτεϊνών, Ενισχυτική Μάθηση, Βαθειά Μάθηση, Συνελικτικά Νευρωνικά Δίκτυα, Αλγόριθμος Q-learning με βαθιά ενίσχυση μάθησης, Foldit
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
7
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
154
Αριθμός σελίδων:
125
Thesis DeepFoldit Dimitra Panou.pdf (3 MB) Άνοιγμα σε νέο παράθυρο