Εφαρμογές πολυπαραμετρικών στατιστικών τεχνικών στη χημική ανάλυση

Διδακτορική Διατριβή uoadl:1308904 638 Αναγνώσεις

Μονάδα:
Κατεύθυνση Αναλυτική Χημεία
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2012-07-10
Έτος εκπόνησης:
2012
Συγγραφέας:
Φαρμάκη Ελένη
Στοιχεία επταμελούς επιτροπής:
Κ. Ευσταθίου Καθηγητής ΕΚΠΑ, Ν. Θωμαΐδης Επίκουρος Καθηγητής ΕΚΠΑ, Μ. Κουππάρης Καθηγητής ΕΚΠΑ
Πρωτότυπος Τίτλος:
Εφαρμογές πολυπαραμετρικών στατιστικών τεχνικών στη χημική ανάλυση
Γλώσσες διατριβής:
Ελληνικά
Περίληψη:
Σε αυτή τη διατριβή μελετήθηκε η εφαρμογή πολυπαραμετρικών τεχνικών σε μεγάλες
βάσεις δεδομένων ταξινόμησης, με σκοπό τη θεωρητική τους παρουσίαση, τη
σύγκριση αυτών και την εξαγωγή συμπερασμάτων, σχετικά με το πεδίο εφαρμογής
τους και το χειρισμό τους, τις δυνατότητες και τους περιορισμούς τους.
Χρησιμοποιήθηκαν μη επιβλεπόμενες τεχνικές όπως Principal Components
Analysis/Fa¬ctor¬ Analysis (PCA/FA) και Cluster Analysis (CA) αλλά και
επιβλεπόμενες όπως Discriminant Analysis (DA), Classification Trees (CT) και
Artificial Neural Networks (ANN). Ιδιαίτερη έμφαση δόθηκε στις τεχνικές CT και
ANN (μελετήθηκαν τρεις μέθοδοι και αρχιτεκτονικές αντίστοιχα για καθεμιά από
αυτές). Ερευνήθηκαν τα πλεονεκτήματα, μειονεκτήματα και ιδιαιτερότητες τους και
βελτιστοποιήθηκαν τα μοντέλα ταξινόμησης των τεχνικών. Όλες οι τεχνικές
συγκρίθηκαν μεταξύ τους, με κριτήριο τα αποτελέσματα τους (της ορθής
ταξινόμησης των δειγμάτων) σε τρεις βάσεις δεδομένων οι οποίες αφορούσαν τους
προσδιορισμούς α) μετάλλων-μεταλλοειδών στους τρεις ταμιευτήρες που
χρησι¬μο¬ποιούνται για την ύδρευση της πρωτεύουσας (Υλίκη, Μόρνο και Μαραθώνα),
β) μετάλλων-μεταλλοειδών και ανόργανων στοι¬χείων σε θαλάσσια δείγματα ιζημάτων
από μεγάλες ιχθυο¬καλλιέργειες της χώρας, γ) σπανίων γαιών σε δείγματα
ελαιολάδων από διάφορες περιοχές.
Η DA αν και είναι παραμετρική τεχνική με πολλούς περιορισμούς στην εφαρμογή
της, ανταποκρίθηκε στις ανάγκες των προβλημάτων και παρείχε πάντα μια πρώτη
άποψη για το πρόβλημα (δυνατότητα ή όχι γραμμικού διαχωρισμού των ομάδων με
βάση το Canonical plot της ανάλυσης και αρχική αξιολόγηση των μεταβλητών). Τα
ποσοστά ορθής ταξινόμησης που παρείχε ήταν αρκετές φορές συγκρίσιμα με των πιο
προηγμένων τεχνικών. Τα CT με 3 διαφορετικές μεθόδους και αρκετή ευελίξία
(παρείχαν πολλές παραμέτρους προς δοκιμή και βελτιστοποίηση), επέτυχαν υψηλά
ποσοστά ταξινόμησης με λίγες ή πολλές μεταβλητές (περισ¬σότερες συνήθως των
ANN), κατασκευάζοντας επαναλήψιμα μοντέλα με δυνατότητες γενί¬κευσης. Τα ANN
αποδείχθηκαν ιδιαίτερα ευέλικτη τεχνική, με δυνατότητες αποτε¬λεσματικής
αξιολόγησης των μεταβλητών και εφαρμογής τους σε απλές αλλά και πολυπλο¬κότερες
βάσεις προσεγγίζοντας γραμμικές και μη γραμμικές συναρτήσεις. Κατασκευάστηκαν
ανθεκτικά και ευέλικτα μοντέλα. Μειονέκτημά τους αποτέλεσαν ωστόσο, τα
φαινόμενα υπερ-προσα¬ρμογής που παρουσιάζουν και χρειάστηκαν προσεκτικοί
χειρισμοί για την αποφυγή τους.
Έτσι, τα διαθέσιμα δείγματα διαχωρίστηκαν σε τρεις ομάδες: χρησιμοποιήθηκαν
εκτός της συνήθους ομάδας εκπαίδευσης, επιπλέον ομάδες επικύρωσης και ελέγχου.
Με τον τρόπο αυτό, έγινε άμεση ταυτοποίηση των φαινομένων υπερ-προσα¬ρμογής
(ώστε να διακόπτεται αυτό¬ματα η εκπαίδευση του μοντέ¬λου), αλλά και δοκιμή
των μοντέλων σε νέα, “’αγνωστα” δείγμα¬τα, ώστε να ελέγχεται η δυνα¬τό¬τητα
γενίκευσης αυτών. Ο διαχωρισμός σε ομάδες έγινε είτε τυχαία (όπως επιτάσσει η
σύγχρονη βιβλιογραφία), είτε με βάση της προκατεργασίας με DA (μέθοδος που δεν
έχει χρησιμο¬ποιηθεί ποτέ στο παρελθόν). Επιπλέον, έγινε προσπάθεια εφαρμογής
όσο το δυνατόν απλούστερων δομών με λίγες παραμέτρους (μεταβλητές, βάρη) αλλά
και λειτουργικές μονάδες επεξεργασίας (νευρώνες).
Λέξεις-κλειδιά:
Πολυπαραμετρικές τεχνικές, Δέντρα ταξινόμησης, Τεχνητά Νευρωνικά Δίκτυα, Φαινόμενα υπερ-προσαρμογής, Μοντέλα ταξινόμησης
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
15-23, 279-282, 363-366
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
406
Αριθμός σελίδων:
452

 


attachments.zip
2 MB
Δεν επιτρέπεται η πρόσβαση στο αρχείο.