Πέργαμος - Βιβλιοθήκη και Κέντρο Πληροφόρησης Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών

Μονάδα:

Κατεύθυνση Βιοπληροφορική-Υπολογιστική Βιολογία
Βιβλιοθήκη Σχολής Θετικών Επιστημών

Ημερομηνία κατάθεσης:

2022-11-21

Έτος εκπόνησης:

2022

Συγγραφέας:

Κάνε Ρεντιόνα

Στοιχεία επιβλεπόντων καθηγητών:

Ηρακλής Βαρλάμης, Αναπληρωτής Καθηγητής , Τμήμα Πληροφορικής και Τηλεματικής, Χαροκόπειο Πανεπιστήμιο

Πρωτότυπος Τίτλος:

«Εφαρμογή αλγορίθμων Νευρωνικών Δικτύων σε βιοϊατρικά δεδομένα»

Γλώσσες εργασίας:

Ελληνικά

Μεταφρασμένος τίτλος:

Εφαρμογή αλγορίθμων Νευρωνικών Δικτύων σε βιοϊατρικά δεδομένα

Περίληψη:

Η παρούσα εργασία αποσκοπεί στην εφαρμογή των τεχνικών της Μηχανικής και Βαθιάς Μάθησης πάνω στα βιοϊατρικά δεδομένα της επιδημιολογική μελέτης HELIAD για τις νευροψυχιατρικές διαταραχές στη τρίτη ηλικία. Για το σκοπό αυτό αξιοποιήθηκαν οι σύγχρονοι αλγόριθμοι Νευρωνικών Δικτύων που παρέχονται από τις ιδιαίτερα ανεπτυγμένες και εκλεπτυσμένες βιβλιοθήκες της Keras και του TensorFlow, και βέβαια του διόλου αμελητέου scikit-learn.

Επιχειρήθηκε η ανάπτυξη Τεχνητών Νευρωνικών Δικτύων Πρόσθιας τροφοδότησης για την πολυμεταβλητή ταξινόμηση δύο μεταβλητών, της G1 για το βαθμό της απώλειας μνήμης με μια κλίμακα από πέντε πιθανές κλάσεις, και της G21, για την κλινική διάγνωση της άνοιας, με τρεις κλάσεις. Στο γενικότερο πλαίσιο των αλγορίθμων Νευρωνικών Δικτύων δοκιμάστηκαν οι Autoencoders και ο μη επιτηρούμενος αλγόριθμος συσταδοποίησης SOM, ο οποίος κατατάσσεται κατά γενική ομολογία στους αλγόριθμους αυτούς.

Το σύνολο από τα πρωτογενή δεδομένα της HELIAD είχε δύο βασικά μειονεκτήματα, ένα μεγάλο αριθμό ελλιπών τιμών, και πολύ υψηλές διαστάσεις αναλογικά με το σύνολο των καταχωρήσεων. Προς επίλυση των προβλημάτων αυτών, εφαρμόστηκε μια μεθοδολογία εργασίας η οποία περιλάμβανε μαζί με την εκπαίδευση, δύο διαφορετικές στρατηγικές προεπεξεργασίας , κυρίως για τη συμπλήρωση των ελλιπών τιμών, ενώ ταυτόχρονα αναζητούσε μέσω Grid Search τις καλύτερες υπερπαραμέτρους για τη μοντελοποίηση.

Όσον αφορά τη μείωση των διαστάσεων, αρχικά αφαιρέθηκαν κάποιες μεταβλητές χειρωνακτικά, μετά από προσεκτική μελέτη του συνόλου δεδομένων, ενώ αναπτύχθηκαν και οι Autoencoders ως μέσο κωδικοποίησης των πιο σημαντικών μεταβλητών.

Για την ταξινόμηση σε κλάσεις κάθε μεταβλητής δοκιμάστηκαν αρκετά μοντέλα με διαφορετικές υπερπαμέτρους και αρχιτεκτονικές έως ότου βρεθούν εκείνα που είχαν την καλύτερη ακρίβεια πρόβλεψης. Τα τελικά μοντέλα επιλέχθηκαν όχι μόνο βάσει της αποτελεσματικότητάς τους αλλά συνολικά για τη βέλτιστη μεθοδολογία εργασίας μαζί με τα βήματα προεπεξεργασίας του συνόλου δεδομένων.

Κύρια θεματική κατηγορία:

Θετικές Επιστήμες

Λοιπές θεματικές κατηγορίες:

Τεχνολογία – Πληροφορική

Λέξεις-κλειδιά:

Βιοπληροφορική, Νευρωνικά Δίκτυα, Μηχανική Μάθηση

Ευρετήριο:

Ναι

Αρ. σελίδων ευρετηρίου:

Εικονογραφημένη:

Ναι

Αρ. βιβλιογραφικών αναφορών: