Machine Learning Techniques and Cell Irradiation

Διπλωματική Εργασία uoadl:2885292 572 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοπληροφορική-Υπολογιστική Βιολογία
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2019-11-11
Έτος εκπόνησης:
2019
Συγγραφέας:
Παπακωνσταντίνου Δημήτριος
Στοιχεία επιβλεπόντων καθηγητών:
Γεωργακίλλας Αλέξανδρος, Αναπληρωτής Καθηγητής, ΣΕΜΦΕ, ΕΜΠ
Τρουγκάκος Ιωάννης, Επίκουρος Καθηγητής , Βιολογικό, ΕΚΠΑ
Χατζηιωάννου Αριστοτέλης, Ερευνητής Γ', ΙΒΦΧΒ, ΕΙΕ
Πρωτότυπος Τίτλος:
Machine Learning Techniques and Cell Irradiation
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Τεχνικές Μηχανικής Μάθησης στην πρόβλεψη της Επίδρασης της ακτινοβολίας στην Επιβίωση Κυττάρων
Περίληψη:
Αυτή είναι μία εργασία πάνω στο πως τεχνικές μηχανικής μάθησης (Machine Learning) μπορούν να χρησιμοποιηθούν ώστε να προβλέψουν το βιολογικό αποτέλεσμα την ακτινοβόλησης κυττάρων. Το πρόβλημα συνίσταται στην πρόβλεψη των ποσοτήτων του Σχετική Βιολογικής Επίδρασης (RBE) και των παραμέτρων α και β του τετραγωνικού προτύπου. Η ποσότητες λαμβάνουν συνεχείς τιμές, αρά πρόκειται για να πρόβλημα πολυπαραγοντικής παλινδρόμησης. Η ποσότητα RBE στην περίπτωση μας, σηματοδοτεί, το εύρος του αποτελέσματος της ακτινοβολίας στην επιβίωσης των κυττάρων. Οι παράμετροι α και β, αναπαριστούν την γραμμική και τετραγωνική συνεισφορά, σε σχέση με τη δόση, στον κυτταρικό θάνατο αντίστοιχα. Γίνεται χρήση 3 αλγορίθμων και 2 συνόλων δεδομένων. Οι αλγόριθμοι που χρησιμοποιήθηκαν ήταν, Gradient Boosting Decision Trees (GBDT), ο Random Forest Regression (RF) και Support Vector Regression (SVR). Δύο υλοποιήσεις του GBDT αλγορίθμου χρησιμοποιήθηκαν. Σαν επιπλέον δοκιμή εφαρμόστηκε και ο αλγόριθμος voting regression (VR) ως μέθοδο ψηφοφορίας επί όλων των προηγούμενων μοντέλων, ο οποίος προβλέπει τις εξαρτημένες μεταβλητές βάσει μιας μεθόδου συναίνεσης. Οι αλγόριθμοι που χρησιμοποιήθηκαν είχαν ριζικά διαφορετική αρχιτεκτονική και προσέγγιση στο πρόβλημα, μεταξύ τους. Ο στόχος ήταν, να συνδυαστούν διαφορετικές τεχνικές και να δειχθεί ότι ένα συνδυαστικό μοντέλο αποδίδει καλύτερα σε προβλεπτική ικανότητα και δυνατότητα γενίκευσης. Τα αποτελέσματα δείχνουν ότι αλγόριθμος CatBoost που είναι μια υλοποίηση του GBDT αλγορίθμου αποδίδει σχετικά καλύτερα στην πρόβλεψη και στη γενίκευση. Τα σύνολα δεδομένων μας συνίστανται σε πειράματα ακτινοβόλησης ιονίζουσας ακτινοβολίας με ιόντα και φορτισμένα σωμάτια, και περιέχουν μεταβλητές σχετικές με την αντικείμενο της ακτινοβόλησης όπως το είδος του κυττάρου, φάση του κυτταρικού κύκλου, καρκινικά ή μη κύτταρα και αφετέρου ιδιότητες της ακτινοβολίας όπως τη Γραμμική Μεταφορά Ενέργειας (LET), ειδική ενέργεια, το είδος του ιόντος και την τροπικότητα της ακτινοβόλησης. Τα σύνολα δεδομένων είναι σχετικά μικρά, αποτελούμενα από πειράματα που έχουν γίνει με διαφορετικές μεθόδους και γενικώς δεν μπορούν να ληφθούν ως "μαύρο κουτί". Δείχνεται ότι τα δεδομένα είναι κάπως θορυβώδη και περιέχουν πολλαπλές συγγραμικότητες. Η όλη εργασία έχει ως σκοπό την επίδειξη της χρησιμότητας των τεχνικών ensemble και των τεχνικών συναίνεσης στην πρόβλεψη των αναφερθέντων ποσοτήτων. Αναβάθμιση της προβλεπτικής ικανότητας των προηγούμενων ποσοτήτων πριν την ραδιοθεραπεία είναι εφικτή με χρήση πιο μεγάλου και πιο συνεκτικού συνόλου δεδομένων. Επίσης, χρειάζεται μια πιο εις βάθος ανάλυση ώστε, να καταλήξουμε σε ποιες μεταβλητές είναι πιο καθοριστικές στην πρόβλεψη. Περαιτέρω ενσωμάτωση δεδομένων που αφορούν σε φωτονική ακτινοβόληση χρειάζεται ώστε να γίνουν οι εκτιμητές μας πιο γενικής χρήσης σε ευρύτερο πλαίσιο της ραδιοβιολογίας.
Κύρια θεματική κατηγορία:
Θετικές Επιστήμες
Λέξεις-κλειδιά:
Μηχανική Μάθηση, Ραδιοβιολογία, Ραδιοθεραπία
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
44
Αριθμός σελίδων:
64
dimitris_papakonstantinou_MSc_thesis.pdf (1 MB) Άνοιγμα σε νέο παράθυρο