«Ανακάλυψη ενζύμων βιοτεχνολογικού ενδιαφέροντος μέσω μεταγονιδιωματικής ανάλυσης αλληλουχιών»

Διπλωματική Εργασία uoadl:3418092 56 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοπληροφορική-Υπολογιστική Βιολογία
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2024-09-30
Έτος εκπόνησης:
2024
Συγγραφέας:
Βεργουλίδης Νικόλαος
Στοιχεία επιβλεπόντων καθηγητών:
Γεώργιος Παυλόπουλος, Ερευνητής Ά, Ε.Κ.Ε.Β.Ε "Αλέξανδρος Φλέμινγκ"
Ζωή Λίτου, μέλος Ε.ΔΙ,Π., Τμήμα Βιολογίας ΕΚΠΑ,
ΝΙκόλαος Παπανδρέου, μέλος Ε.ΔΙ.Π., Τμήμα Βιολογίας ΕΚΠΑ
Πρωτότυπος Τίτλος:
«Ανακάλυψη ενζύμων βιοτεχνολογικού ενδιαφέροντος μέσω μεταγονιδιωματικής ανάλυσης αλληλουχιών»
Γλώσσες εργασίας:
Ελληνικά
Αγγλικά
Μεταφρασμένος τίτλος:
«Ανακάλυψη ενζύμων βιοτεχνολογικού ενδιαφέροντος μέσω μεταγονιδιωματικής ανάλυσης αλληλουχιών»
Περίληψη:
Το μεταγονιδίωμα αναφέρεται στο σύνολο του γενετικού υλικού που περιέχεται σε ένα περιβαλλοντικό δείγμα. Η ανάλυση των μεταγονιδιωμάτων έχει ιδιαίτερη σημασία για την εύρεση και κατανόηση της αλληλουχίας, της δομής και λειτουργίας νέων πρωτεϊνών, καθώς και για τον εντοπισμό νέων ενζύμων που μπορούν να χρησιμοποιηθούν στη βιοτεχνολογία. Η αλληλούχιση μεταγονιδιωμάτων μέσω της μεθόδου shotgun είναι η πιο διαδεδομένη προσέγγιση για τη μελέτη και την ταξινόμηση μικροοργανισμών που προέρχονται από διαφορετικά βιοσυστήματα (biomes).
Στα πλαίσια αυτής της εργασίας, επιστρατεύτηκαν βιοπληροφορικές μέθοδοι με κεντρικό στόχο την ανακάλυψη ενζύμων βιοτεχνολογικού ενδιαφέροντος και τη λειτουργική ανάλυση πρωτεϊνικών αλληλουχιών από μεταγονιδιωματικά σύνολα δεδομένων. Η εργασία εστιάζει σε βακτηριακά ένζυμα με εφαρμογές στη βιοϊατρική και τη βιοτεχνολογία και χρησιμοποιεί προηγμένες μέθοδους αναζήτησης και ομαδοποίησης για δεδομένα που είναι καταχωρημένα σε εγκεκριμένες βάσεις μεταγονιδιωματικών δεδομένων, όπως οι IMG/M, MGnify και UniParc. Τα αποτελέσματα της ομαδοποίησης θα χρησιμοποιηθούν για τη δημιουργία τρισδιάστατων δομικών μοντέλων ενζύμων με τη χρήση της τεχνητής νοημοσύνης (A.I) ενώ τα μοντέλα αυτά θα αποτελέσουν τη βάση για την εξερεύνηση των μηχανισμών ενζυμικής δράσης, προκειμένου να επιλεχθούν τα κατάλληλα ένζυμα για την εκάστοτε εφαρμογή καθώς και να σχεδιαστούν στο μέλλον καινοτόμα ένζυμα.
Με το πέρας της εργασίας, έχει ολοκληρωθεί η ανάλυση της βάσης δεδομένων UniParc (~544 εκατομμύρια καταχωρήσεις) σε σχέση με συγκεκριμένες αυτοτελείς δομικές περιοχές (πρωτεϊνικά domains) από τέσσερις μεγάλες οικογένειες όπως οι: Nattokinase, Feruloyl Esterases, Cocaine Esterases, Petases Pet Hydrolases. Τα δεδομένα για τα πρωτεϊνικά προφίλ προήλθαν από τις βάσεις δεδομένων που είναι μέλη της InterPro: Pfam, PRINTS, PANTHER, PROSITE patterns, Tigrfams, SUPERFAMILY. Για την ανάλυση, χρησιμοποιήθηκαν διακριτές μέθοδοι βιοπληροφορικής ανάλυσης ενώ για το χειρισμό του μεγάλου όγκου δεδομένων αναπτύχθηκαν ροές σε διαφορες γλώσσες προγραμματισμού. Τα εργαλεία ανάλυσης ενσωματώθηκαν σε ολοκληρωμένες ροές εργασίας χρησιμοποιώντας τη γλώσσα nextflow και διατίθενται σε ένα από τα δημόσια αποθετήρια κώδικα όπως το GitHub. Τα αποτελέσματα της ανάλυσης, συμπεριλαμβανομένων των διακριτών στρατολογημένων πρωτεϊνών στις οποίες κατέληξε η εργασία, διατίθενται σε βάση δεδομένων με τη μορφή διαδικτυακής εφαρμογής (Meta-4) στην οποία ο χρήστης μπορεί να περιηγηθεί και να αναγνώσει τα χαρακτηριστικά των πρωτεϊνικών καταχωρήσεων, των τρισδιάστατων δομικών μοντέλων και τα μεταδεδομένα αυτών.
Κύρια θεματική κατηγορία:
Θετικές Επιστήμες
Λέξεις-κλειδιά:
Μεταγονιδίωμα, Μεταγονιδιωματική Ανάλυση, Πρωτεϊνικά Domains, Ενζυμική Δραστηριότητα, Ομαδοποίηση Πρωτεϊνικών Αλληλουχιών
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
2
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
85
Αριθμός σελίδων:
85
Διπλωματική Βεργουλίδης.pdf (9 MB) Άνοιγμα σε νέο παράθυρο