Δημιουργία πακέτου R ανάλυσης γονιδιακής έκφρασης κυττάρων που αναγνωρίζει τις κυτταρικές καταστάσεις και ανακατασκευάζει ρυθμιστικά δίκτυα για τις πιθανές μεταβάσεις καταστάσεων με μη-εποπτευόμενη μηχανική μάθηση

Διπλωματική Εργασία uoadl:2899167 161 Αναγνώσεις

Μονάδα:
Διιδρυματικό ΠΜΣ Τεχνολογίες Πληροφορικής στην Ιατρική και τη Βιολογία
Πληροφορική
Ημερομηνία κατάθεσης:
2020-03-10
Έτος εκπόνησης:
2020
Συγγραφέας:
ΜΑΛΕΣΙΟΥ ΕΥΘΥΜΙΑ
Στοιχεία επιβλεπόντων καθηγητών:
Ηλίας Μανωλάκος, Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
Δημιουργία πακέτου R ανάλυσης γονιδιακής έκφρασης κυττάρων που αναγνωρίζει τις κυτταρικές καταστάσεις και ανακατασκευάζει ρυθμιστικά δίκτυα για τις πιθανές μεταβάσεις καταστάσεων με μη-εποπτευόμενη μηχανική μάθηση
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
Δημιουργία πακέτου R ανάλυσης γονιδιακής έκφρασης κυττάρων που αναγνωρίζει τις κυτταρικές καταστάσεις και ανακατασκευάζει ρυθμιστικά δίκτυα για τις πιθανές μεταβάσεις καταστάσεων με μη-εποπτευόμενη μηχανική μάθηση
Περίληψη:
Η δυνατότητα ποσοτικοποίησης κι ανάλυσης των προφίλ γονιδιακής έκφρασης σε επίπεδο μονήρων κυττάρων (single-cells), έχει επιτρέψει τη μελέτη της ετερογένειας των κυτταρικών πληθυσμών στους ιστούς, την αναγνώριση σπάνιων καταστάσεων και τη διερεύνηση του ρόλου τους και των αποτελεσμάτων της αλληλεπίδρασής τους με το μικρο-περιβάλλον. Ιδιαίτερο ενδιαφέρον, παρουσιάζει η μελέτη των δυναμικών μεταβάσεων ή τροχιών που σχηματίζονται μεταξύ ζευγών κυτταρικών καταστάσεων. Πρόσφατα, αναπτύχθηκαν αρκετοί αλγόριθμοι για την ανακατασκευή τροχιών, οι κύριες διαφορές μεταξύ των οποίων, είναι η απαίτηση εκ των προτέρων πληροφορίας, ο τρόπος διαμόρφωσης της τοπολογίας, η διάταξη των κυττάρων και το μαθηματικό πλαίσιο στο οποίο βασίζονται.
Στη δημοσίευση των Τσακανίκα Π., Μανατάκη Δ. και Μανωλάκου Η.Σ., «Machine learning methods to reverse engineer dynamic gene regulatory networks governing cell state transitions», bioRxiv, 2018 (DOI: http://dx.doi.org/10.1101/264671), περιγράφεται ένα πιθανοτικό πλαίσιο μη-εποπτευόμενης μηχανικής μάθησης για την ανακατασκευή δυναμικών γονιδιακών ρυθμιστικών δικτύων που καθοδηγούν τη μετάβαση μεταξύ κυτταρικών καταστάσεων, εισαγάγοντας, ταυτόχρονα, την έννοια των μικρο-καταστάσεων σε μία τροχιά. Για τη δημιουργία του προτύπου που περιγράφει το «επιγενετικό τοπίο», χρησιμοποιείται ένα μείγμα κανονικών κατανομών με τις εκ των υστέρων πιθανότητες που προκύπτουν να καθορίζουν τις κυτταρικές καταστάσεις και τις πιθανές μεταβάσεις μεταξύ τους. Περαιτέρω, σε κάθε τροχιά μετάβασης που σχηματίζεται (μετάβαση από την κατάσταση «έναρξης» προς την κατάσταση «προορισμού»), προσδιορίζονται διαδοχικές μικρο-καταστάσεις (φάσεις μετάβασης) κι αναγνωρίζονται τα κύρια γονίδια – ρυθμιστές, καταλήγοντας στη δημιουργία στοχευμένων αιτιατών γονιδιακών ρυθμιστικών δικτύων ανά μικρο-κατάσταση.
Η παρούσα διπλωματική εργασία, αφορά στη δημιουργία πακέτου R (MLscAN: Machine Learning single-cell ANalytics) που βασίζεται στη μεθοδολογία της παραπάνω δημοσίευσης (Tsakanikas P. και συν., 2018), με δυνατότητα ευέλικτης εκτέλεσης όλων των βημάτων, με μόνη απαιτούμενη είσοδο, τα προ-επεξεργασμένα δεδομένα έκφρασης. Εκτός των προκαθορισμένων επιλογών, δίνεται η ευχέρεια στους χρήστες να ενσωματώσουν σε οποιοδήποτε βήμα της διαδικασίας, δικούς τους αλγορίθμους ή ήδη διαθέσιμα αποτελέσματα, αλλά, και να παρέμβουν μετά τη δημιουργία του προτύπου MLscAN, τροποποιώντας στοιχεία στοχευμένα. Το πακέτο, μπορεί να χρησιμοποιηθεί για την παραγωγή κι οπτικοποίηση των αποτελεσμάτων ανάλυσης σε διαφορετικά στάδια της ροής επεξεργασίας· από τη διερεύνηση του προ-επεξεργασμένου πίνακα δεδομένων έως τη μείωση της διαστατικότητας, τον προσδιορισμό των κυτταρικών καταστάσεων και των πιθανών μεταβάσεων, την εξαγωγή των τροχιών και των μικρο-καταστάσεων, την αναγνώριση των κύριων γονιδίων και την κατασκευή των αιτιατών γονιδιακών ρυθιστικών δικτύων στο επίπεδο της μικρο-κατάστασης, με χρήση μη-εποπτευόμενων μεθοδολογιών μηχανικής μάθησης.
Τέλος, το πακέτο R χρησιμοποιήθηκε στην εργασία, για την ανάλυση ενός δημοσιευμένου συνόλου δεδομένων που αφορά στην τροχιά από-διαφοροποίησης β-κυττάρων των νησιδίων του Langerhans ατόμων με σακχαρώδη διαβήτη τύπου 2, με στόχο τη διερεύνηση των αποτελεσμάτων που παραγάγονται σε σχέση με τις επιλεγμένες παραμέτρους.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
μονήρη κύτταρα, μετάβαση μεταξύ καταστάσεων, επιγενετικό τοπίο, τροχιά, μικρο-κατάσταση, γονιδιακό ρυθμιστικό δίκτυο
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
15
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
67
Αριθμός σελίδων:
177