Εξόρυξη γνώσης από αρχεία μεγάλου όγκου δεδομένων υγείας -big data-με χρήση υπολογιστικών αλγορίθμων ανάλυσης-health analytics

Διδακτορική Διατριβή uoadl:2967626 76 Αναγνώσεις

Μονάδα:
Βιβλιοθήκη Επιστημών Υγείας
Τμήμα Νοσηλευτικής
Ημερομηνία κατάθεσης:
2021-11-30
Έτος εκπόνησης:
2021
Συγγραφέας:
Μήνου Ιωάννης
Στοιχεία επταμελούς επιτροπής:
Ιωάννης Μαντάς, Καθηγητής, Τμήμα Νοσηλευτικής, ΕΚΠΑ
Φλώρα Μαλαματένιου, Καθηγήτρια, Τμήμα Ψηφιακών Συστημάτων, ΠΑΠΕΙ
Δάφνη Καϊτελίδου, Αναπληρώτρια Καθηγήτρια, Τμήμα Νοσηλευτικής, ΕΚΠΑ
Γεώργιος Φιλντίσης, Καθηγητής, Τμήμα Νοσηλευτικής, ΕΚΠΑ
Αθηνά Καλοκαιρινού, Καθηγήτρια, Τμήμα Νοσηλευτικής, ΕΚΠΑ
Παναγιώτης Μπαμίδης, Καθηγητής, Τμήμα Ιατρικής, ΑΠΘ
Μαριάννα Διομήδους, Καθηγήτρια, Τμήμα Νοσηλευτικής, ΕΚΠΑ
Πρωτότυπος Τίτλος:
Εξόρυξη γνώσης από αρχεία μεγάλου όγκου δεδομένων υγείας -big data-με χρήση υπολογιστικών αλγορίθμων ανάλυσης-health analytics
Γλώσσες διατριβής:
Ελληνικά
Μεταφρασμένος τίτλος:
Εξόρυξη γνώσης από αρχεία μεγάλου όγκου δεδομένων υγείας -big data-με χρήση υπολογιστικών αλγορίθμων ανάλυσης-health analytics
Περίληψη:
Η μεγαλύτερη πρόκληση των σύγχρονων υπολογιστικών συστημάτων είναι αναμφισβήτητα η αποδοτική αποθήκευση και ανάκτηση πολύ μεγάλου όγκου δεδομένων. Η ανάγκη αυτή έκανε την εμφάνισή της τα τελευταία χρόνια λόγω της έκρηξης δεδομένων που παρατηρείται στο διαδίκτυο και αποκτά ολοένα και μεγαλύτερη σημασία λόγω του πολύ μεγάλου εύρους πληροφοριών που μπορούμε να αντλήσουμε. Ο τομέας της υγειονομικής περίθαλψης και των ιατρικών δεδομένων είναι συνεχώς και ταχέως εξελισσόμενος. Η αξιοποίηση των Big Data στο χώρο της υγείας προσφέρει πολύτιμη πληροφόρηση καθώς παρουσιάζουν απεριόριστες δυνατότητες για αποτελεσματική αποθήκευση, επεξεργασία, sql queries και ανάλυση ιατρικών δεδομένων.
Σκοπός της παρούσας διατριβής είναι η μελέτη τεχνικών εξόρυξης γνώσης για δεδομένα μεγάλου όγκου, που αφορούν το πεδίο της Υγείας. Παράλληλα σκοπός της έρευνας είναι η μελέτη στατιστικών και υπολογιστικών αλγορίθμων ανάλυσης μεγάλου όγκου δεδομένων υγείας που έχουν ως αποτέλεσμα την παραγωγή νέας γνώσης καθώς και την εξαγωγή στατιστικά σημαντικής πληροφορίας για τους επαγγελματίες υγείας. Τέλος, η παρούσα διατριβή διερευνά τις γνώσεις των επιστημόνων της Πληροφορικής Υγείας και των επαγγελματιών υγείας σχετικά με τα Big Data.
Στην παρούσα διδακτορική διατριβή έγινε βιβλιογραφική ανασκόπηση της έννοιας των Big Data. Η ανασκόπηση αυτή περιλαμβάνει τον ορισμό των Big Data ,τα χαρακτηριστικά τους, τα πλεονεκτήματα και τα μειονεκτήματά τους στο χώρο της υγείας. Στη συνέχεια γίνεται αναφορά στην υλοποίηση και στους μηχανισμούς αποθήκευσης των Big Data. Επιπλέον γίνεται αναφορά στα συστήματα ανάλυσης και επεξεργασίας μεγάλου όγκου δεδομένων, στις γλώσσες προγραμματισμού για Big Data, στην εξόρυξη γνώσης δεδομένων στο χώρο της υγείας. Ακόμη γίνεται αναφορά στη χρήση των Big Data στην Ευρώπη και στον κόσμο. Τέλος παρουσιάζονται οι βασικές αρχές του GDPR καθώς και το πώς σχετίζεται με τα Big Data στο χώρο της υγείας. Επίσης διεξήχθησαν δύο εμπειρικές μελέτες.
Η πρώτη μελέτη είχε σαν στόχο την καταγραφή της άποψης των επιστημόνων της Πληροφορικής Υγείας σχετικά με την τεχνολογία των Big Data. Η συλλογή των δεδομένων έγινε με χρήση ερωτηματολογίου. Η στατιστική ανάλυση έδειξε τη θετική ανταπόκριση του δείγματος σχετικά με την τεχνολογία των Big Data.
Η δεύτερη μελέτη είχε σαν στόχο την καταγραφή της άποψης των Επαγγελματιών Υγείας σχετικά με την τεχνολογία των Big Data. Η συλλογή των δεδομένων έγινε με χρήση ερωτηματολογίου. Η στατιστική ανάλυση δεν έδωσε επαρκείς απαντήσεις καθώς οι ερωτηθέντες έδειξαν θετική στάση απέναντι στα Big Data ενώ απάντησαν ότι δεν γνωρίζουν πολλά για τη συγκεκριμένη τεχνολογία.
Το τελευταίο κομμάτι της διατριβής περιλαμβάνει την ανάπτυξη μεθόδων πρόβλεψης για την δυνατότητα διάγνωσης των ασθενών με καρδιαγγειακά νοσήματα. Οι μέθοδοι πρόβλεψης που χρησιμοποιήθηκαν είναι: Λογιστική Παλινδρόμηση, Naive Bayes Classifier, Δένδρα αποφάσεων, Αλγόριθμος Κ κοντινότερων γειτόνων, Αλγόριθμος SVM (Support Vector Machine) και Random Forest. Η ανάπτυξη περιλάμβανε όλα τα στάδια προεπεξεργασίας των δεδομένων ενώ χρησιμοποιήθηκαν συγκεκριμένες μετρικές για τη μέτρηση της απόδοσης των κατηγοριοποιητών. Τέλος έγιναν βελτιώσεις της απόδοσης των κατηγοριοποιητών χρησιμοποιώντας διασταυρωτική επαλήθευση με την μέθοδο cross-validation ενώ επιλύθηκε και το πρόβλημα της ανισορροπίας των κλάσεων χρησιμοποιώντας τη μέθοδο SMOTE.
Κύρια θεματική κατηγορία:
Επιστήμες Υγείας
Λέξεις-κλειδιά:
Εμπειρική μελέτη, Big data, Επαγγελματίες υγείας, Εξόρυξη γνώσης, Τεχνικές κατηγοριοποίησης
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
130
Αριθμός σελίδων:
228