Υπολογιστική Μελέτη της Δομής και της Οργάνωσης των Συντηρημένων μη Εκφραζομένων Στοιχείων (CNE) στα Ευκαρυωτικά Γονιδιώματα ως εργαλείο διερεύνησης της πιθανής λειτουργίας και της εξελικτικής δυναμικής τους

Διδακτορική Διατριβή uoadl:1309491 440 Αναγνώσεις

Μονάδα:
Τομέας Βιοχημείας Μοριακής Βιολογίας
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2014-10-29
Έτος εκπόνησης:
2014
Συγγραφέας:
Πολυχρονόπουλος Δημήτριος
Στοιχεία επταμελούς επιτροπής:
Γ. Κ. Ροδάκης Καθηγητής ΕΚΠΑ (επιβλέπων), Σ. Ι. Χαμόδρακας Καθηγητής ΕΚΠΑ, Δρ. Γ. Αλμυράντης Ερευνητής Α’ Ε.Κ.Ε.Φ.Ε. "Δημόκριτος"
Πρωτότυπος Τίτλος:
Υπολογιστική Μελέτη της Δομής και της Οργάνωσης των Συντηρημένων μη Εκφραζομένων Στοιχείων (CNE) στα Ευκαρυωτικά Γονιδιώματα ως εργαλείο διερεύνησης της πιθανής λειτουργίας και της εξελικτικής δυναμικής τους
Γλώσσες διατριβής:
Ελληνικά
Μεταφρασμένος τίτλος:
Computational Study of the Structure and Organization of Conserved Noncoding Elements (CNE) in Eukaryotic Genomes as a tool in order to elucidate their potential function and evolutionary dynamics
Περίληψη:
Στην παρούσα διατριβή επιχειρήσαμε να αναλύσουμε την χωροταξική οργάνωση των
Συντηρημένων Μη Εκφραζομένων Στοιχείων (CNE) σε γονιδιώματα σπονδυλωτών και
ασπόνδυλων, με σκοπό να διαπιστώσουμε αν μπορούμε να εξάγουμε κάποια
συμπεράσματα για το πώς εξελίχθησαν αυτές οι αλληλουχίες με βάση την κατανομή
τους στα χρωμοσώματα. Διαπιστώσαμε ότι οι αποστάσεις αυτών ακολουθούν κατανομές
τύπου νόμου δύναμης σε μια ποικιλία γονιδιωμάτων. Τέτοιου τύπου κατανομές
συνδέονται με συσχετίσεις μακράς εμβέλειας και μορφοκλασματικότητα (έννοιες που
έχουν προταθεί για τη στερεοδιαμόρφωση της δομής της χρωματίνης του πυρήνα) και
φαίνεται ότι απαντώνται πολύ συχνά στο γονιδίωμα, όπως προκύπτει από τη μελέτη
διαφόρων στοιχείων του, σε πληθώρα οργανισμών. Δεδομένου ότι τα CNE σχετίζονται
χωρικά με γονίδια, ειδικά με αυτά που ρυθμίζουν αναπτυξιακές διαδικασίες,
επιβεβαιώσαμε ότι ένα πρότυπο νόμου δύναμης διατηρείται ανεξάρτητα από το εάν
συμπεριληφθούν στοιχεία που βρίσκονται εντός ή εκτός γονιδίων. Όσο πιο «αρχαία»
είναι αυτά τα στοιχεία τόσο πιο εκτεταμένες γραμμικότητες δίνουν σε διπλή
λογαριθμική κλίμακα, δηλαδή τόσο πιο πολύ συμβάλουν στις παρατηρούμενες
κατανομές. Προτείναμε ένα εξελικτικό μοντέλο για την κατανόηση αυτών των
ευρημάτων που περιλαμβάνει γεγονότα τμηματικών διπλασιασμών ή διπλασιασμών
ολόκληρου του γονιδιώματος και απαλοιφές των περισσοτέρων από τα διπλασιασμένα
CNE. Προσομοιώσεις που πραγματοποιήσαμε αναπαράγουν τα κύρια χαρακτηριστικά των
παρατηρουμένων κατανομών μεγέθους. Τα CNE παρουσιάζουν ενδιαφέρουσες ιδιότητες
σύστασης και γι’αυτό επιχειρήσαμε να δούμε αν μπορούν να κατηγοριοποιηθούν με
βάση αυτές τους τις ιδιότητες. Πιο συγκεκριμένα είναι γενικά αλληλουχίες
πλούσιες σε A+T ενώ περιβάλλονται από περιοχές χαμηλού Α+Τ. Προσπαθήσαμε,
λοιπόν, να ταξινομήσουμε στοιχεία που βρίσκονται υπό επιλεκτική πίεση (εξώνια
και CNE) με δύο μεθόδους μηχανικής μάθησης: «Γραφήματα Ν-γραμμάτων» (N-Gram
Graphs, NGGs) και «Ανάλυση κ-μερών» (Logic Alignment Free, LAF). Διαπιστώσαμε
ότι και με τις δύο μεθόδους, που για πρώτη φορά εφαρμόστηκαν στα πλαίσια
ανάλυσης γονιδιωματικών δεδομένων, είναι εφικτή η κλασμάτωση αλληλουχιών του
γονιδιώματος (CNE, εξώνια) σε διαφορετικές κατηγορίες μεταξύ γονιδιωμάτων ή
εντός του ίδιου γονιδιώματος. Χρησιμοποιήσαμε στις αναλύσεις / συγκρίσεις μας
κατάλληλες αναπληρωματικές αλληλουχίες που απομονώνονταν από το εκάστοτε
γονιδίωμα έτσι ώστε να έχουν ίδιο μήκος και ποσοστό GC% με τις υπό μελέτη
αλληλουχίες μας (CNE / εξώνια). Συγκρίναμε τα αποτελέσματα ταξινόμησης που
πήραμε και από τις δύο μεθόδους με μια άλλη ευρέως διαδεδομένη προσέγγιση
διαχωρισμού ολόκληρων γονιδιωμάτων που αναφέρεται ως «Γονιδιωματικές Υπογραφές»
(Genomic Signatures, GS). Η μελέτη μας αυτή ήταν η πρώτη εφαρμογή των
«Γονιδιωματικών Υπογραφών» στην κατάταξη μικρών βιολογικών αλληλουχιών μεγέθους
< 50 kb.
Για τις ανάγκες όλων των προαναφερθέντων πειραματικών προσεγγίσεων προχωρήσαμε
και σε ταυτοποίηση καινούριων στοιχείων CNE στα γονιδιώματα του ανθρώπου (H.
sapiens), του σκώληκα (C. elegans) και της μύγας (D. melanogaster). Τα στοιχεία
αυτά ταυτοποιήθηκαν έτσι ώστε να προέρχονται από οργανισμούς που να έχουν
αποκλίνει από τον κοινό τους εξελικτικό πρόγονο παρόμοιες χρονικές περιόδους.
Ενδιαφέρουσες συσχετίσεις και διαφοροποιήσεις μεταξύ αυτών των στοιχείων
παρατηρήθηκαν με τη χρήση μεθόδων μηχανικής μάθησης που αναφέρθηκαν πιο πριν.
Πιο συγκεκριμένα είδαμε ότι αλληλουχίες CNE που παρουσιάζουν υψηλή ομοιότητα (
> 95% και έως 100%) μεταξύ στοιχίσεων γονιδιωμάτων ανθρώπου / κοτόπουλου
φαίνεται πως συνιστούν μια διακριτή κατηγορία υπερσυντηρημένων στοιχείων που
επιτελεί λειτουργίες που μένει να ανακαλυφθούν. Το εντυπωσιακό αυτό ποσοστό
συντηρητικότητας είναι ακόμα μεγαλύτερο από αυτό που παρατηρείται στα εξώνια
(συγκρίνοντας τους δύο αυτούς οργανισμούς, άνθρωπο - κοτόπουλο), ενώ δεν είναι
γνωστή κάποια λειτουργία στη φύση, που να απαιτεί τόσο υψηλό βαθμό ομοιότητας
σε επίπεδο αλληλουχίας.
Λέξεις-κλειδιά:
Συντηρημένες μη κωδικοποιούσες αλληλουχίες , Συγκριτική γονιδιωματική, Υπερσυντηρημένες αλληλουχίες, Κατάταξη βιολογικών αλληλουχιών, Εξέλιξη γονιδιώματος
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
165
Αριθμός σελίδων:
xiii, 150