Ordinary and Bayesian LASSO for Regression Models

Διπλωματική Εργασία uoadl:1936145 794 Αναγνώσεις

Μονάδα:
Κατεύθυνση Στατιστική και Επιχειρησιακή Έρευνα
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2017-09-25
Έτος εκπόνησης:
2017
Συγγραφέας:
Μαρκουλιδάκης Ανδρέας
Στοιχεία επιβλεπόντων καθηγητών:
Λουκία Μελιγκοτσίδου, Επ. Καθηγήτρια, Τμήματος Μαθηματικών
Φώτιος Σιάννης, Επ. Καθηγητής, Τμήματος Μαθηματικών
Σάμης Τρέβεζας, Λέκτορας, Τμήματος Μαθηματικών
Πρωτότυπος Τίτλος:
Ordinary and Bayesian LASSO for Regression Models
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Κλασσικό και Μπεϋζιανό LASSO σε Μοντέλα Παλινδόμησης
Περίληψη:
Η παρούσα διπλωματική εργασία πραγματεύεται τις ιδιότητες του Κλασσικού και Μπεϋζιανού LASSO σε Μοντέλα Παλινδρόμησης. Ο Τελεστής Απόλυτης Συρρίκνωσης και Επιλογής (LASSO), είναι μία μέθοδος που συρρικνώνει τους συντελεστές ενός μοντέλου και ταυτόχρονα επιλέγει τις σημαντικές επεξηγητικές μεταβλητές ανάμεσα σε ένα σύνολο από πολλές μεταβλητές. Στο πλαίσιο του κανονικού γραμμικού μοντέλου, η μέθοδος βασίζεται σε αλγορίθμους κυρτού προγραμματισμού υπό τον περιορισμό (ποινή) της νόρμας, που πραγματοποιεί επιλογή μεταβλητών μέσω της συρρίκνωσης των μη στατιστικά σημαντικών μεταβλητών ακριβώς στο μηδέν. Στο πλαίσιο του COX μοντέλου, η μέθοδος βασίζεται στην μεγιστοποίηση της πιθανοφάνειας του μοντέλου, και πάλι υπό τον περιορισμό (ποινή) της νόρμας που έχει το ίδιο αποτέλεσμα όπως στην περίπτωση της γραμμικής παλινδρόμησης. Στο Μπεϋζιανό πλαίσιο, παίρνουμε τους εκτιμητές LASSO ως την κορυφή της εκ των υστέρων κατανομής κατά Μπέυς, όταν επιλέξουμε ως εκ των προτέρων κατανομή για τις μεταβλητές τη Διπλή-Εκθετική, ανεξάρτητα για κάθε μεταβλητή.
Το LASSO προτάθηκε από τον Robert Tibshirani (1996) και αναπτύχθηκε περαιτέρω από τους Efron et al. (2004), οι οποίοι πρότειναν τον αλγόριθμο LARS ως επαρκή αλγόριθμο για τον υπολογισμό του LASSO. Το LASSO για το COX μοντέλο προτάθηκε από τον Tibshirani (1997) και η λύση του προκύπτει από μία παραλλαγή του αλγορίθμου Newton-Raphson. Για το Μπεϋζιανό LASSO στην κανονική γραμμική παλινδρόμηση, ο Tibshirani (1996) πρότεινε μια εκ των προτέρων κατανομή που είναι ανάλογη του λογαρίθμου της πυκνότητας της Διπλής-Εκθετικής κατανομής, και στη συνέχεια προτάθηκαν πολλά μοντέλα, από τους Park και Casella (2008), Ντζούφρας και Λύκου (2012) και πολλούς άλλους, καθώς το Μπεϋζιανό LASSO αποτελεί ένα ενεργό τομέα της Μπεϋζιανής Στατιστικής.
Στο κεφάλαιο 1 περιγράφεται το πολλαπλό γραμμικό μοντέλο, οι μέθοδοι ελαχίστων τετραγώνων και μέγιστης πιθανοφάνειας, καθώς και μέθοδοι ελέγχου καλής προσαρμογής και επιλογής μεταβλητών. Στην συνέχεια περιγράφουμε τη μέθοδο LASSO για το γραμμικό μοντέλο (κεφάλαιο 2) και το μοντέλο COX (κεφάλαιο 3). Στο κεφάλαιο 4, παραθέτουμε τις αρχές της Μπεϋζιανής Θεωρίας και των αλγορίθμων MCMC, ενώ στο κεφάλαιο 5 το Μπεϋζιανό LASSO στο πλαίσιο του γραμμικού μοντέλου. Τέλος, στα κεφάλαια 6 και 7, παρουσιάζουμε και αναλύουμε τα αποτελέσματα των εφαρμογών των μεθόδων που παρουσιάστηκαν στα προηγούμενα κεφάλαια σε προσομοιωμένα (κεφάλαιο 6) και πραγματικά (κεφάλαιο 7) δεδομένα.
Κύρια θεματική κατηγορία:
Θετικές Επιστήμες
Λέξεις-κλειδιά:
LASSO, OLS, Bayesian LASSO
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
40
Αριθμός σελίδων:
89
Αρχείο:
Δεν επιτρέπεται η πρόσβαση στο αρχείο. H πρόσβαση επιτρέπεται μόνο εντός του δικτύου του ΕΚΠΑ.

Ordinary and Bayesian LASSO for Regression Models.pdf
2 MB
Δεν επιτρέπεται η πρόσβαση στο αρχείο. H πρόσβαση επιτρέπεται μόνο εντός του δικτύου του ΕΚΠΑ.