Πρόβλεψη τύπου καρκίνου με αλγόριθμους μηχανικής μάθησης, μια βιολογικοκεντρική προσέγγιση

Διπλωματική Εργασία uoadl:3401625 12 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοπληροφορική-Υπολογιστική Βιολογία
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2024-06-21
Έτος εκπόνησης:
2024
Συγγραφέας:
Σλέιμαν Ηλίας
Στοιχεία επιβλεπόντων καθηγητών:
Βασιλική Οικονομίδου, Αναπληρώτρια Καθηγήτρια, Τμήμα Βιολογίας, ΕΚΠΑ, (Επιβλέπουσα)
Αριστοτέλης Χατζηιωάννου, Ερευνητής Α', Κέντρο Συστημικής Βιολογίας , Ίδρυμα Ιατροβιολογικών Ερευνών Ακαδημίας Αθηνών
Ιωάννης Τρουγκάκος Καθηγητής Τμήμα Βιολογίας, ΕΚΠΑ
Πρωτότυπος Τίτλος:
Πρόβλεψη τύπου καρκίνου με αλγόριθμους μηχανικής μάθησης, μια βιολογικοκεντρική προσέγγιση
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
Πρόβλεψη τύπου καρκίνου με αλγόριθμους μηχανικής μάθησης, μια βιολογικοκεντρική προσέγγιση
Περίληψη:
Ο Τριπλά Αρνητικός Καρκίνος του Μαστού αποτελεί έναν υποτύπο του καρκίνου του μαστού, στον οποίο υποεκφράζονται ο υποδοχέας των οιστρογόνων (ER), ο υποδοχέας της προγεστερόνης (PR) και ο υποδοχέας που είναι υπεύθυνος για την ενίσχυση του ανθρώπινου επιδερμικού παράγοντα ανάπτυξης (HER2). Η ανάπτυξη αποτελεσματικών μεθόδων διάγνωσης και θεραπείας για τον TNBC παραμένει μία από τις μεγαλύτερες προκλήσεις στον τομέα της ογκολογίας. Η μηχανική μάθηση, δηλαδή η ανάπτυξη αλγορίθμων και στατιστικών μοντέλων που επιτρέπουν στους υπολογιστές να μαθαίνουν από τα δεδομένα και να κάνουν προβλέψεις ή να παίρνουν αποφάσεις με βάση αυτά, χωρίς να είναι ρητά προγραμματισμένοι για κάθε επιμέρους εργασία, αναδεικνύεται ως ένα ισχυρό εργαλείο στην αντιμετώπιση αυτής της πρόκλησης. Η ενσωμάτωση της μηχανικής μάθησης στο πεδίο της βιολογίας έχει επιδείξει εντυπωσιακά αποτελέσματα στην γονιδιωματική ανάλυση για την έρευνα ασθενειών πετυχαίνοντας έγκαιρη και ακριβή πρόβλεψη και διάγνωση πολλών ασθενειών, βελτιώνοντας σημαντικά τη λήψη κλινικών αποφάσεων.
Στο πλαίσιο αυτής της διπλωματικής εργασίας έγινε προσπάθεια ενσωμάτωσης δεδομένων μικροσυστοιχιών γονιδιακής έκφρασης και βιολογικών οντολογικών όρων για την εκπαίδευση αλγορίθμων μηχανικής μάθησης που θα κατηγοριοποιούν ασθενείς με βάση συγκεκριμένο τύπο καρκίνου του μαστού. Οι κλάσεις κατηγοριοποίησης είναι η TNBC και η Non-TNBC. Οι αλγόριθμοι μηχανικής μάθησης εκπαιδευτήκαν χρησιμοποιώντας μεταγραφικά δεδομένα γονιδίων που βρέθηκαν να παίζουν σημαντικό ρόλο στον TNBC (υπογραφή γονιδίων TNBC) καθώς και μεταγραφικά δεδομένα της IRE1 υπογραφής (IRE1sign38). Η πρωτεΐνη αυτή έχει αποδειχθεί ότι αποτελεί ισχυρό βιολογικό δείκτη για πολλούς σπάνιους και επιθετικούς καρκίνους όπως ο TNBC, στον οποίο η υψηλή IRE1 δραστηριότητα έχει συνδεθεί με την επιθετικότητα του και με την δυσμενή πιθανότητα ολικής επιβίωσης, μέσω του μονοπατιού IRE1-XBP1. Για την εξαγωγή της γονιδιακής υπογραφής του TNBC, πραγματοποιήσαμε ανάλυση διαφορικής έκφρασης γονιδίων και στη συνέχεια πραγματοποιήσαμε λειτουργική ανάλυση εμπλουτισμού για τον προσδιορισμό των σημαντικότερων γονίδιων με βάση τις λειτουργίες και τα μοριακά μονοπάτια στα οποία συμμετέχουν και τα οποία περιγράφουν τα φαινοτυπικά χαρακτηριστικά της ασθένειας. Τα αποτελέσματα για την IRE1 δραστηριότητα και των XBP1 και RIDD συνιστωσών της, μετατράπηκαν σε ετικέτες διαστρωμάτωσης ασθενών ανάλογα με τη δραστηριότητα κάθε δείγματος, ώστε να χρησιμοποιηθούν σαν επιπλέον χαρακτηριστικά εκπαίδευσης του αλγορίθμου μηχανικής μάθησης. Στο τελικό στάδιο της εργασίας εκπαιδεύσαμε διάφορους αλγόριθμους ταξινόμησης, μεταξύ των οποίων οι Random Forest και Generalized Linear Models (Lasso and Elastic-Net Regularized) παρουσίασαν τις πιο υποσχόμενες επιδόσεις. Στη συνέχεια χρησιμοποιώντας μόνο τα πιο σημαντικά χαρακτηριστικά εκπαίδευσης, βελτιώσαμε σημαντικά την απόδοση πρόβλεψης αυτών των αλγορίθμων καταλήγοντας στα δύο επικρατέστερα μοντέλα κατηγοριοποίησης: “RF_Top_50” και “GLM.4”. Τα ευρήματα μας αποκάλυψαν την κρισιμότητα των γονιδίων-κόμβων που προέκυψαν από τη λειτουργική ανάλυση καθώς και τη σημασία της σηματοδοτικής δραστηριότητας της IRE1 πρωτεΐνης στον TNBC, γεγονός που ενισχύει τον ισχυρισμό του σημαντικού βιολογικού δείκτη πρόγνωσης. Η περεταίρω βελτίωση ορισμένων τεχνικών ανάλυσης και η ενσωμάτωση επιπλέον omics δεδομένων ή/και οντολογικών όρων λειτουργιών και μοριακών μονοπατιών, θα μπορούσε να θέσει τα μοντέλα που αναπτύξαμε, ως ισχυρά εργαλεία στα χέρια της ιατρικής κοινότητας, για την πρόγνωση και την ανάπτυξη θεραπευτικών στρατηγικών για τους καρκίνους του μαστού, όπως ο TNBC.
Κύρια θεματική κατηγορία:
Θετικές Επιστήμες
Λέξεις-κλειδιά:
Τριπλά-Αρνητικός Καρκίνος του Μαστού, Καρκίνος του Μαστού, Μηχανική Μάθηση, Πρόβλεψη, Βιολογικοκεντρική Προσέγγιση, δεδομένα μικροσυστοιχιών, οντολογίες, TNBC, IRE1 υπογραφή, Σπάνιοι καρκίνοι, λειτουργική ανάλυση εμπλουτισμού, κατηγοριοποίηση
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
158
Αριθμός σελίδων:
147
Αρχείο:
Δεν επιτρέπεται η πρόσβαση στο αρχείο έως 2026-06-26.

Ilias_Sleiman_THESIS_Final_2024.pdf
5 MB
Δεν επιτρέπεται η πρόσβαση στο αρχείο έως 2026-06-26.