Πέργαμος - Βιβλιοθήκη και Κέντρο Πληροφόρησης Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών

Μονάδα:

Κατεύθυνση Βιοπληροφορική-Επιστήμη Βιοϊατρικών Δεδομένων
Πληροφορική

Ημερομηνία κατάθεσης:

2024-04-11

Έτος εκπόνησης:

2024

Συγγραφέας:

Χρυσούλα Θεοδώρα

Στοιχεία επιβλεπόντων καθηγητών:

Δρ. Θεόδωρος Δαλαμάγκας, Διευθυντής Ερευνών, Ινστιτούτο Πληροφοριακών Συστημάτων, Ερευνητικό Κέντρο Αθηνά.
Δρ. Χρήστος Δίου, Επίκουρος Καθηγητής, Τμήμα Πληροφορικής και Τηλεματικής, Χαροκόπειο Πανεπιστήμιο

Πρωτότυπος Τίτλος:

Explainable Artificial Intelligence for Deep Learing Methods in Chest X-Ray Classification

Γλώσσες εργασίας:

Αγγλικά

Μεταφρασμένος τίτλος:

Μέθοδοι Ερμηνευσιμότητας σε Μοντέλα Βαθιάς Μηχανικής Μάθησης για την Κατηγοριοποίηση Ακτινογραφιών Θώρακος

Περίληψη:

Οι ακτινογραφίες θώρακα αποτελούν ένα σημαντικό εργαλείο για τον εντοπισμό διαφόρων παθολογιών στο θώρακα. Οι αλγόριθμοι μηχανικής μάθησης που χρησιμοποιούνται για την κατηγοριοποίηση αυτών των ανωμαλιών χαρακτηρίζονται ως «μαύρα κουτιά» λόγω της αυξανόμενης πολυπλοκότητάς τους. Για την εφαρμογή αυτών των αλγορίθμων είναι απαραίτητη η χρήση και η ανάπτυξη μεθόδων ερμηνευσιμότητας (eXplainable Artificial Intelligence, XAI). Η παρούσα μελέτη χρησιμοποιεί το σύνολο δεδομένων VinBigData που περιλαμβάνει 18,000 οπισθο-πρόσθιας (PA) προβολής ακτινογραφίες θώρακα.
Στόχος αυτής της εργασίας είναι η ταξινόμηση και η δημιουργία χαρτών ερμηνείας έξι παθολογιών του θώρακα: ‘Aortic Enlargement’, ‘Cardiomegaly’, ‘Lung Opacity’, ‘Pleural Effusion’, ‘Pleural Thickening’, ‘Pulmonary Fibrosis’ και της κλάσης ‘No-Finding’ που αντιπροσωπεύει τις υγιείς ακτινογραφίες. Για την ταξινόμηση των ανωμαλιών χρησιμοποιείται ένα προ-εκπαιδευμένο ResNet50 μοντέλο στο σύνολο δεδομένων ImageNet και η μέθοδος ερμηνευσιμότητας είναι η Grad-Cam. Για την αξιολόγηση της Grad-Cam χρησιμοποιείται η μετρητική Intersection over Union (IoU) και η ανάλυση σημαντικότητας εικονοστοιχείων.
Το μοντέλο επιτυγχάνει ένα F1 score 0.81, με την κλάση ‘No-Finding’ να κατέχει την υψηλότερη τιμή. Οι κλάσεις ‘Aortic Enlargement’ και ‘Cardiomegaly’ παρουσιάζουν ικανοποιητικά αποτελέσματα, ενώ οι κλάσεις ‘Lung Opacity’ και ΄Pulmonary Fibrosis’ παρουσιάζουν τις χαμηλότερες τιμές. Από τους χάρτες ερμηνείας που προκύπτουν από την εφαρμογή της Grad-Cam, παρατηρείται η ικανότητα εντοπισμού των κλάσεων ‘Aortic Enlargement’ και ‘Cardiomegaly’, ενώ για τις υπόλοιπες κλάσεις παρουσιάζουν λιγότερα αξιόπιστα αποτελέσματα. Παρόλο, που αυτή η μελέτη καταλήγει σε ενθαρρυντικά αποτελέσματα, η ταξινόμηση των ακτινογραφιών θώρακα με μοντέλα βαθιάς μηχανικής μάθησης απαιτεί την περαιτέρω ανάπτυξη μεθόδων ερμηνευσιμότητας.

Κύρια θεματική κατηγορία:

Θετικές Επιστήμες

Λέξεις-κλειδιά:

Κατηγοριοποίηση, Ερμηνεία Συνελικτικών Δικτύων, Ακτινογραφίες Θώρακα, Επεξηγηματική Τεχνητή Νοημοσύνη, Grad-Cam

Ευρετήριο:

Όχι

Αρ. σελίδων ευρετηρίου:

Εικονογραφημένη:

Ναι

Αρ. βιβλιογραφικών αναφορών:

Αριθμός σελίδων:

Αρχείο: