Στοιχεία επιβλεπόντων καθηγητών:
Γεωργακίλας Αλέξανδρος,Αναπληρωτής Καθηγητής,Τομέας Φυσικής,Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών,Εθνικό Μετσόβειο Πολυτεχνείο
Βοργιάς Κωνσταντίνος,Καθηγητής ,Τομέας Βιοχημείας και Μοριακής Βιολογίας, Τμήμα Βιολογίας,Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Μπάγκος Παντελεήμων,Καθηγητής ,Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική, Πανεπιστήμιο Θεσσαλίας
Περίληψη:
Τα τελευταία χρόνια, η ανακάλυψη νέων θεραπειών κατά των λοιμώξεων έχει καταστεί επείγουσα εξαιτίας της ταχέως αυξανόμενης αντίστασης που εμφανίζεται έναντι στα συμβατικά αντιβιοτικά. Το γεγονός οτι τα περισσότερα δυνητικά αντιβιοτικά αποτυγχάνουν να σκοτώσουν παθογόνους οργανισμούς έχει αναπτύξει την ανάγκη σχεδιασμού νέων αντιμικροβιακών φορέων και η κλινική έρευνα πλέον επενδύει στην ταυτοποίηση νέων, μη συμβατικών θεραπειών κατά των μολύνσεων. Τα αντιμικροβιακά πεπτίδια (AMPs) έχουν κεντρίσει το ενδιαφέρον των ερευνητικών ομάδων ως νέα υποψήφια φάρμακα και χάρη στην ικανότητά τους να προστατεύουν το ξενιστή από ποικίλα παθογόνα βακτήρια είναι γνωστά και ως πεπτίδια άμυνας του ξενιστή. Πρόκειται για ολιγοπεπτίδια όπου ο αριθμός των αμινοξικών καταλοίπων τους κυμαίνεται συνήθως από πέντε ως εκατό και δρουν αποτελεσματικά έναντι ποικίλων στόχων, όπως είναι τα βακτήρια, οι ιοι, οι μύκητες και τα παράσιτα. Τα φυσικά αντιμικροβιακά πεπτίδια απαντώνται τόσο σε προκαρυωτικούς (π.χ. βακτήρια) όσο και σε ευκαρυωτικούς οργανισμούς (π.χ. πρωτόζωα, μύκητες, φυτά, έντομα και ζώα) και τα περισσότερα εμφανίζουν κατιονική και αμφιπαθητική ιδιότητα. Η αμφιπαθητικότητα τους τα καθιστά ιδανικά για το σχηματισμό διεπαφών και τους δίνει την ικανότητα διατάραξης της φυσικής ακεραιότητας της μικροβιακής μεμβράνης. Επιπλέον, οι ηλεκτροστατικές δυνάμεις μεταξύ της αρνητικά φορτισμένης βακτηριακής μεμβράνης και των κατιονικών αντιμικροβικακών πεπτιδίων, είναι ακόμα ένας καθοριστικός παράγοντας αυτής της αλληλεπίδρασης πεπτιδίου – μεμβράνης. Το ευρύ φάσμα των ιδιοτήτων που χαρακτηρίζουν τα αντιμικροβιακά πεπτίδια καθιστά τον in-silico σχεδιασμό νέων συνθετικών AMPs μια σοβαρή πρόκληση. Αρκετές δημόσιες βάσεις δεδομένων έχουν ηδη δημιουργηθεί με αποθηκευμένη πληροφορία για εκατοντάδες AMPs. Η ταυτοποίηση και ο χαρακτηρισμός των AMPs και των λειτουργικών τους τύπων έχει οδηγήσει σε πολλές μελέτες και ένας μεγάλος αριθμός μεθόδων έχει προταθεί για αυτόν τον σκοπό. Οι περισσότερες μέθοδοι έχουν εξάγει πληροφορία από την στοίχιση αλληλουχιών, ωστόσο, η αμινοξική σύνθεση δεν μπορεί να επεξηγήσει πάντα πλήρως τους μηχανισμούς αλληλεπίδρασης των AMPs. Πρόσφατα, η μηχανική εκμάθηση έχει συντελέσει στην ανάπτυξη διάφορων μεθόδων πρόβεψης, οι οποίες βασίζονται στα συνθετικά χαρακτηριστικά της αμινοξικής αλληλουχίας των AMPs.
Σκοπός της παρούσας διπλωματικής εργασίας είναι η υλοποίηση μιας καινοτόμου υπολογιστικής μεθοδολογίας μηχανικής μάθησης που θα προσφέρει τη δυνατότητα χαρακτηρισμού των πεπτιδίων με βάση την αντιφλεγμονώδη ή/και την αντικαρκινική τους δράση. Το πρώτο βήμα ήταν η συλλογή πεπτιδίων από διάφορες κατηγορίες βιοδραστηριότητας, αντικαρκινική, αντιμικροβιακή, αντιβακτηριακή, αντιμυκητιακή, αντιϊική και εντομοκτόνα από τις υπάρχουσες βάσεις δεδομένων DRAMP και DAMPD, ως το θετικό δείγμα εκπαίδευσης. Παράλληλα, από τη Uniprot συλλέχθησαν πεπτίδια μήκους 10 ως 100 καταλοίπων με το κριτήριο να μην ανήκουν σε κάποια κατηγορία βιοδραστηριότητας, ως το αρνητικό δείγμα εκπαίδευσης. Η τεχνική της τυχαίας υπερδειγματοληψίας και υποδειγματοληψίας χρησιμοποιήθηκε για την αύξηση ή τη μείωση, αντίστοιχα, των δειγμάτων και το τελικό σύνολο πεπτιδίων διαμορφώθηκε σε 1491 πεπτίδια, 213 από κάθε μελετώμενη κατηγορία. Στη συνέχεια, υπολογίστηκε, για κάθε ένα πεπτίδιο, ένας αριθμός (44) από φυσικοχημικά και ακολουθιακά χαρακτηριστικά, τα οποία εχει αποδειχθεί να αποτελούν τα πιο αντιπροσωπευτικά στον χαρακτηρισμό των αντιμικροβιακών πεπτιδίων. Με αυτόν τον τρόπο δημιουργήθηκε το σύνολο δεδομένων εκπαίδευσης του μοντέλου πρόβλεψης. Το δεύτερο βήμα ήταν η εκτέλεση της EnsembleGASVR μεθοδολογίας ταξινόμησης, μιας υπολογιστικής μεθόδου που προτάθηκε στο παρελθόν για την πρόβλεψη ουδέτερων και παθογενών πολυμορφισμών κατηγοριοποιώντας τους Σημειακούς Μονονουκλεοτιδικούς Πολυμορφισμούς (SNPs) σε ουδέτερους και σε αυτούς που σχετίζονται με κάποια ασθένεια. Η εν λόγω μεθοδολογία συνδυάζει έναν ταξινομητή Support Vector Regression (SVR) και έναν Γενετικό Αλγόριθμο (GA). Επιπροθέτως, η μέθοδος αυτή έχει βελτιωθεί κατόπιν αντικατάστασης του γενετικού αλγόριθμου με έναν εξελικτικό multi-objective αλγόριθμο, σε μια προσπάθεια επίτευξης αυξημένης απόδοσης. Η μεθοδολογία αυτή έχει το πλεονέκτημα ότι χειρίζεται με πολύ αποδοτικό τρόπο τις ελλιπείς τιμές ενώ επίσης τα μοντέλα που εξάγονται από αυτήν παρέχουν και ένα βαθμό εμπιστοσύνης για κάθε πρόβλεψη τους. Επιπλέον κατασκευάστηκε και ένα δοκιμαστικό σύνολο δεδομένων, που εφαρμόστηκε ως είσοδος στο μοντέλο για την αξιολόγηση της απόδοσής του με βάση το αν προέβλεψε σωστά ή όχι την κατηγορία στην οποία ανήκει κάθε πεπτίδιο. Η εκτέλεση του αλγόριθμου επαναλήφθηκε πέντε φορές και ο μέσος όρος της ακρίβειας πρόβλεψης υπολογίστηκε 66.77 ενώ η διακύμανση υπολογίστηκε 31.07. Απώτερος σκοπός είναι η βελτίωση της απόδοσης και τελικά η εφαρμογή των εκπαιδευμένων μοντέλων σε ένα αυξημένο σύνολο από αχαρακτήριστα πεπτίδια που περιλαμβάνονται σε φυτικούς οργανισμούς έτσι ώστε να προταθούν καινούρια πεπτίδια και φυτά που μπορούν να χρησιμοποιηθούν για την καταπολέμηση των φλεγμονών αλλά και την πρόληψη κατά του καρκίνου.
Λέξεις-κλειδιά:
αντιμικροβιακό πεπτίδιο, βιοδραστηριότητα, αντιμικροβιακές ιδιότητες, Mηχανική Eκμάθηση,Ταξινόμηση