Ελλείπουσες τιμές λόγω περικοπής μετρήσεων σε διαχρονικά συνεχή δεδομένα: χρήση μοντέλων για πληροφοριακή περικοπή όταν η αποκοπή είναι αγνοήσιμη.

Διπλωματική Εργασία uoadl:1310991 637 Αναγνώσεις

Μονάδα:
Κατεύθυνση Βιοστατιστική
Βιβλιοθήκη Επιστημών Υγείας
Ημερομηνία κατάθεσης:
2014-01-09
Έτος εκπόνησης:
2013
Συγγραφέας:
Κουλάι Λουμπιάνα
Στοιχεία επιβλεπόντων καθηγητών:
Παναγιώτα Τουλούμη Αναπλ. Καθηγήτρια, Φώτης Σιάννης Επικ. Καθηγητής, Νίκος Πανταζής Βιοστατιστικός
Πρωτότυπος Τίτλος:
Ελλείπουσες τιμές λόγω περικοπής μετρήσεων σε διαχρονικά συνεχή δεδομένα: χρήση μοντέλων για πληροφοριακή περικοπή όταν η αποκοπή είναι αγνοήσιμη.
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
Missing values due to dropout in longitudinal data: applications of joint models for ignorable missing data
Περίληψη:
Η ανάλυση πολλαπλών ανά άτομο, διαχρονικών μετρήσεων συχνά γίνεται πιο
περίπλοκη λόγω ύπαρξης ελλειπουσών τιμών. Μια συνηθισμένη περίπτωση είναι αυτή
κατά την οποία η προγραμματισμένη σειρά μετρήσεων διακόπτεται πρόωρα εξαιτίας
της εμφάνισης κάποιου συμβάματος. Χαρακτηριστικό παράδειγμα αποτελούν οι
μελέτες φυσικής ιστορίας της HIV-1 λοίμωξης όπου οι μετρήσεις ενός βιολογικού
δείκτη διακόπτονται λόγω θανάτου του ασθενούς. Παράλληλα, μετρήσεις πέρα από
κάποιο χρονικό σημείο αποκόπτονται τεχνητά, κατά το στάδιο της ανάλυσης, επειδή
ο ασθενής ανέπτυξε κλινικό AIDS ή άρχισε να λαμβάνει αντιρετροϊκή θεραπεία (και
οι δυο αυτοί παράγοντες σηματοδοτούν εξ’ ορισμού την φυσική ιστορία της νόσου).
Στην περίπτωση όπου μηχανισμοί αποκοπής όπως οι παραπάνω σχετίζονται με μη
παρατηρούμενες ποσότητες, η περικοπή χαρακτηρίζεται ως πληροφοριακή και η
εξαγωγή αμερόληπτων εκτιμήσεων για την χρονική εξέλιξη των επιπέδων του δείκτη
απαιτεί χρήση τεχνικών από κοινού μοντελοποίησης (joint models) του δείκτη και
του συμβάματος που οδηγεί στην περικοπή των μετρήσεων. Αντιθέτως, στην
περίπτωση όπου οι μηχανισμοί περικοπής εξαρτώνται μόνο από ήδη παρατηρημένες
τιμές του μελετώμενου δείκτη, η χρήση μεθόδων μέγιστης πιθανοφάνειας οδηγεί σε
αμερόληπτες εκτιμήσεις.
Η εργασία αυτή επικεντρώνεται στην ανάλυση του απόλυτου αριθμού CD4
λεμφοκυττάρων που αποτελεί σημαντικό ανοσολογικό δείκτη κατά την φυσική ιστορία
της HIV-1 λοίμωξης. Σε τέτοια δεδομένα, ο κύριος μηχανισμός περικοπής
μετρήσεων, για άτομα που μολύνθηκαν μετά το 1996, έτος όπου η αντιρετροϊκή
θεραπεία υψηλής δραστικότητας άρχισε να διατίθεται ευρέως, είναι η έναρξη
θεραπείας. Το γεγονός ότι η απόφαση για έναρξη θεραπείας βασίζεται κυρίως σε
ήδη παρατηρημένες μετρήσεις αριθμού CD4 λεμφοκυττάρων, κάνει τον μηχανισμό αυτό
θεωρητικά τουλάχιστον αγνοήσιμο. Τα πραγματικά δεδομένα που χρησιμοποιήθηκαν
προέρχονται από την Ελληνική προοπτική μελέτη AMACS, ενώ οι παράμετροι για την
δημιουργία των προσομοιωμένων δεδομένων προέκυψαν από την Ευρωπαϊκή μελέτη
CASCADE. Εφαρμόστηκε ένα μοντέλο τυχαίων επιδράσεων και ένα μοντέλο (JMRE) που
συνδυάζει ένα μικτό μοντέλο για την εκτίμηση της μεταβολής του δείκτη και ένα
λογαριθμικό
μοντέλο επιβίωσης για την πληροφοριακή απόσυρση. Η απόδοση των μοντέλων αυτών
αξιολογήθηκε σε προσομοιωμένα δεδομένα. Κατασκευάστηκαν τέσσερα διαφορετικά
σενάρια που αντανακλούν την περικοπή παρατηρήσεων λόγω έναρξη θεραπείας.
Ο μηχανισμός παραγωγής των ελλειπουσών τιμών καθορίζει την καταλληλότητα της
μεθόδου ανάλυσης που πρέπει να χρησιμοποιηθεί. Το μοντέλο τυχαίων επιδράσεων
δίνει αμερόληπτες εκτιμήσεις παρουσία εντελώς τυχαίων (MCAR) ή τυχαίων
ελλειπουσών (MAR) τιμών. Στις περιπτώσεις που οι ελλείπουσες τιμές οφείλονται
σε δεξιά πληροφοριακή απόσυρση (MNAR) ενδείκνυται η χρήση ενός μοντέλου όπως το
JMRE το οποίο μειώνει την μεροληψία σε σύγκριση με το μοντέλο τυχαίων
επιδράσεων. Τέλος, η χρήση του JMRE μοντέλου σε περιπτώσεις τυχαίων ελλειπουσών
τιμών (MAR) οδηγεί σε μεροληπτικά αποτελέσματα.
Λέξεις-κλειδιά:
Από κοινού μοντέλα, Ελλείπουσες τιμές, Τυχαίες ελλείπουσες τιμές, Μοντέλα μικτών επιδράσεων, Μεροληψία
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
110
Αριθμός σελίδων:
123