«Aξιοποίηση μηχανικής μάθησης για τη μελέτη ιατροβιολογικών δεδομένων σχετικών με τον καρκίνο»

Διπλωματική Εργασία uoadl:2885984 305 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοπληροφορική
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2019-11-20
Έτος εκπόνησης:
2019
Συγγραφέας:
Σπύρου Νικόλαος
Στοιχεία επιβλεπόντων καθηγητών:
Hρακλής Βαρλάμης, Αναπληρωτής Καθηγητής, Τμήμα Πληροφορικής και Τηλεματικής, Χαροκόπειο Πανεπιστήμιο
Πρωτότυπος Τίτλος:
«Aξιοποίηση μηχανικής μάθησης για τη μελέτη ιατροβιολογικών δεδομένων σχετικών με τον καρκίνο»
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
«Aξιοποίηση μηχανικής μάθησης για τη μελέτη ιατροβιολογικών δεδομένων σχετικών με τον καρκίνο»
Περίληψη:
Σε μια εποχή που η επιστημονική πληροφορία παράγεται με ραγδαίους ρυθμούς, η ανάγκη της σταχυολόγησης της από ερευνητές του βιοϊατρικού χώρου και κλινικούς ιατρούς γίνεται άκρως σημαντική. Για αυτόν το λόγο, μια από τις μεγαλύτερες σύγχρονες προκλήσεις της Ιατρικής Πληροφορικής και της Βιοπληροφορικής είναι η δημιουργία συστημάτων που να παρέχουν με αυτοματοποιημένο τρόπο, αξιόπιστες απαντήσεις σε ερωτήσεις βιοϊατρικού περιεχομένου, σε πραγματικό χρόνο.
Κύριος σκοπός της παρούσας εργασίας είναι η ανάλυση και ταξινόμηση ερωτήσεων ιατρικού-κλινικού περιεχομένου με έμφαση στις ερωτήσεις που αφορούν την Ογκολογία. Η επεξεργασία των ερωτήσεων επιχειρήθηκε με μεθόδους της Μηχανικής Μάθησης και της Επεξεργασίας Φυσικής Γλώσσας με απώτερο σκοπό τη εύρεση των βέλτιστων απαντήσεων σε αυτές σύμφωνα με τους κανόνες της Ιατρικής Βασισμένης σε Στοιχεία.
Το σύνολο δεδομένων της παρούσας εργασίας, αντλήθηκε από τη βάση δεδομένων του BioASQ Challenge. To BioASQ Challenge συνίσταται σε ένα παγκόσμιο διαγωνισμό επεξεργασίας επιστημονικών κειμένων και δημιουργίας συστημάτων αυτοματοποιημένης απάντησης στο βιοϊατρικό χώρο. Οι ερωτήσεις χαρακτηρίστηκαν και κατηγοριοποιήθηκαν από δύο ανεξάρτητους ειδικούς, σύμφωνα με κανόνες της Ιατρικής Βασισμένη σε Στοιχεία.
Η αλληλουχία της επεξεργασίας των ερωτήσεων διαχωρίστηκε σε τρία στάδια, καθένα από τα οποία εστίασε σε διαφορετικές ιδιότητες των ερωτήσεων. Στο πρώτο, επιχειρήθηκε η αυτόματη ταξινόμηση των ερωτήσεων σε ερωτήσεις τύπου background, δηλαδή σε ερωτήσεις των οποίων η απάντηση είναι γενικής φύσης, ξεκάθαρη και παγιωμένη και σε ερωτήσεις foreground των οποίων η απάντηση αφορά συγκεκριμένες κλινικές περιπτώσεις και/ή αφορά γνώση που δεν έχει ακόμη ξεκάθαρη απάντηση και αποτελεί αντικείμενο αντιπαράθεσης To δεύτερο στάδιο αφορούσε την αυτόματη ανίχνευση της ύπαρξης των στοιχείων PICO (patient, intervention, comparison, outcome) στις ερωτήσεις foreground. To τρίτο και τελευταίο στάδιο περιείχε την κατηγοριοποίηση των ερωτήσεων σε ερωτήσεις που αφορούν τη θεραπεία, τη διάγνωση, την πρόγνωση ασθενειών καθώς και τη συσχέτιση διαφόρων παραγόντων με ασθένειες.
Σε αυτό το πλαίσιο, καταφέραμε να χαρακτηρίσουμε και να ταξινομήσουμε με επιτυχία, με συνδυασμό διάφορων μοντέλων Μηχανικής Μάθησης κλινικές ερωτήσεις του BioASQ challenge. Συγκεκριμένα, σε καθένα από τα στάδια κατασκευάσαμε μοντέλα που ταξινόμησαν τις ερωτήσεις σε στατιστικά σημαντικό βαθμό σε σχέση με την τυχαιότητα και αρκετές φορές σε επίπεδα συγκρίσιμα με αυτά της ιδανικής ταξινόμησης. Η απόδοση των μοντέλων θεωρήθηκε σημαντική όταν συγκρίθηκε και με τη συμφωνία ανθρώπων - κριτών στην ταξινόμηση των ερωτήσεων.
Η κατηγοριοποίηση των ερωτήσεων με αυτόν τον τρόπο αποσκοπεί στη διευκόλυνση της αναζήτησης των βέλτιστων απαντήσεων στους τύπους κλινικών μελετών που αντιστοιχούν σε κάθε κατηγορία. Φιλοδοξία της παρούσας εργασίας είναι να θέσει τα θεμέλια για τη δημιουργία ενός ολοκληρωμένου συστήματος αυτοματοποιημένης απάντησης βιοϊατρικών ερωτήσεων που να παρέχει απαντήσεις σεβόμενο την ιεράρχηση των στοιχείων της σύγχρονης Ιατρικής Βασισμένης σε Στοιχεία.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
βιοπληροφορική, Ιατρική βασισμένη σε αποδείξεις, μηχανική μάθηση, επεξεργασία φυσικής γλώσσας, κλινικές ερωτήσεις, bioasq
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
3
Εικονογραφημένη:
Όχι
Αρ. βιβλιογραφικών αναφορών:
50
Αριθμός σελίδων:
127
Thesis_Spyrou_Bioinformatics.pdf (1 MB) Άνοιγμα σε νέο παράθυρο