Development and validation of wide-scope retention time prediction models to support suspect and non-target screening of emerging contaminants in environmental samples

Διπλωματική Εργασία uoadl:1320987 332 Αναγνώσεις

Μονάδα:
Κατεύθυνση Αναλυτική Χημεία
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2015-07-21
Έτος εκπόνησης:
2015
Συγγραφέας:
Aalizadeh Reza
Στοιχεία επιβλεπόντων καθηγητών:
Θωμαΐδης Νικόλαος - Αναπλ. Καθηγητής ΕΚΠΑ, Κουππάρης Μιχαήλ - Καθηγητής ΕΚΠΑ, Ευσταθίου Κωνσταντίνος Καθηγητής ΕΚΠΑ
Πρωτότυπος Τίτλος:
Development and validation of wide-scope retention time prediction models to support suspect and non-target screening of emerging contaminants in environmental samples
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Ανάπτυξη και επικύρωση μοντέλων πρόβλεψης χρόνου ανάσχεσης για την ταυτοποίηση αναδυόμενων ρύπων σε περιβαλλοντικά δείγματαμε μη στοχευμένη σάρωση και τεχνικές φασματομετρίας μαζών υψηλής διακριτικής ικανότητας
Περίληψη:
Την τελευταία δεκαετία η εφαρμογή της φασματομετρίας μαζών υψηλής διακριτικής
ικανότητας συζευγμένη με υγροχρωματογραφία (LC-HRMS) έχει αναπτυχθεί ραγδαία
λόγω της ικανότητας της τεχνικής αυτής να ανιχνεύει και να ταυτοποιεί πιθανές ή
ύποπτες και άγνωστες ενώσεις στα περιβαλλοντικά δείγματα. Προκειμένου να
επιτευχθεί αυτός ο σκοπός, πρέπει να αποκτηθούν οι πληροφορίες της ακριβούς
μάζας και του ισοτοπικού προφίλ του ψευδομοριακού ιόντος, να πραγματοποιηθεί
αξιολόγηση των φασμάτων MS/MS και ο χρόνος κατακράτησης να είναι ευλογοφανής
έτσι, ώστε να επιτευχθεί η επιβεβαίωση της ταυτότητας μιας ένωσης. Στο πλαίσιο
αυτό, αναπτύχθηκε μια υπολογιστική μεθοδολογία και τα αντίστοιχα μοντέλα
πρόβλεψης για την κατανόηση της συμπεριφοράς του χρόνου ανάσχεσης ενός μεγάλου
αριθμού αναλυτών που ανήκουν στην κατηγορία των αναδυόμενων ρύπων. Για το σκοπό
αυτό χρησιμοποιήθηκε μια εκτεταμένη βάση δεδομένων που περιέχει την πληροφορία
του χρόνου ανάσχεσης για 528 και 303 αναλύτες σε θετικό και αρνητικό ιοντισμό,
αντίστοιχα, έτσι ώστε να επιτευχθεί η ανάπτυξη μοντέλων πρόβλεψης χρόνου
ανάσχεσης με τη μέγιστη δυνατή περιοχή εφαρμογής (applicability domain). Η βάση
δεδομένων διαχωρίστηκε σε ομάδα εκπαίδευσης (training set) και ομάδα ελέγχου
(test set) με την τεχνική της συσταδοποίησης των Κ-κοντινότερων γειτόνων έτσι,
ώστε να δομηθούν και να επικυρωθούν τα μοντέλα όσο αφορά την προβλεπτική τους
ικανότητα. Το καλύτερο υποσύνολο μοριακών περιγραφέων (molecular descriptors)
επιλέχθηκε με τη χρήση γενετικών αλγόριθμων (genetic algorithms), οι οποίοι
είναι βασισμένοι σε υπολογιστικά εξελικτικά μοντέλα και μπορούν να επιλέξουν
τους πιο αντιπροσωπευτικούς μοριακούς περιγραφείς για όλες τις ενώσεις σε σχέση
με το υπό μοντελοποίηση πρόβλημα. Για τη μοντελοποίηση, χρησιμοποιήθηκαν οι
εξής χημειομετρικές τεχνικές: πολλαπλή γραμμική παλινδρόμηση (MLR), νευρωνικά
δίκτυα (ANNs) και η τεχνική Support Vector Machines (SVM) ώστε να συσχετιστούν
τους, επιλεγμένους μοριακούς περιγραφείς με τον πειραματικά προσδιοριζόμενο
χρόνο ανάσχεσης. Χρησιμοποιήθηκαν πολλές τεχνικές επικύρωσης,
συμπεριλαμβανομένων των ακολούθων: τα κριτήρια Golbraikh-Tropsha, το πεδίο
εφαρμογής βασισμένο στην ευκλείδεια απόσταση, ο συντελεστής r2m, και ο
συντελεστής συμφωνικήςσυσχέτισης (concordance correlation coefficient). Τα
καλύτερα γραμ
μικά και μη γραμμικά μοντέλα για κάθε βάση δεδομένων που προέκυψαν
χρησιμοποιήθηκαν στην πρόβλεψη του χρόνου ανάσχεσης πιθανών/ύποπτων ενώσεων
έτσι, ώστε να επιτευχθεί εξωτερική αξιολόγηση των μοντέλων. Γενικά, η
προτεινόμενη πορεία είναι γρήγορη, αξιόπιστη, ελάχιστα δαπανηρή και μπορεί να
εφαρμοστεί για τη μείωση των ψευδώς θετικών ευρημάτων κατά την εφαρμογή μεθόδων
σάρωσης με LC-HRMS και την επιτυχή ανίχνευση και ταυτοποίηση άγνωστων ενώσεων
σε περιβαλλοντικά δείγματα.
Λέξεις-κλειδιά:
Χρόνος ανάσχεσης, Σάρωση για ύποπτες ενώσεις, Μη στοχευμένη ανάλυση, Φασματομετρία μαζών υψηλής διακριτικής ικανότητας, Tεχνική SVM
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
1-6
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
63
Αριθμός σελίδων:
132