Development of just-in-time query operators for complex data using partial evaluation

Διπλωματική Εργασία uoadl:3395963 28 Αναγνώσεις

Μονάδα:
Κατεύθυνση Μεγάλα Δεδομένα και Τεχνητή Νοημοσύνη
Πληροφορική
Ημερομηνία κατάθεσης:
2024-04-09
Έτος εκπόνησης:
2024
Συγγραφέας:
Ζέρντεβ Αλέξανδρος
Στοιχεία επιβλεπόντων καθηγητών:
Ντούλας Αλέξανδρος, Επίκουρος Καθηγητής, Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Γουνόπουλος Δημήτριος, Καθηγητής, Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Gaidioz Benjamin, PhD RAW Labs SA
Πρωτότυπος Τίτλος:
Development of just-in-time query operators for complex data using partial evaluation
Γλώσσες εργασίας:
Αγγλικά
Ελληνικά
Μεταφρασμένος τίτλος:
Ανάπτυξη τελεστών τελευταίας στιγμής (just-in-time) για ερωτήματα σε σύνθετα δεδομένα με τη χρήση μερικής αξιολόγησης
Περίληψη:
Καθημερινά, τεράστιες ποσότητες δεδομένων παράγονται παγκοσμίως σε διάφορες μορφές, συμπεριλαμβανομένων δομημένων τύπων όπως CSV, XML και JSON, καθώς και μη δομημένων μορφών. Τα δεδομένα αποθηκεύονται σε διάφορες τοποθεσίες, όπως βάσεις δεδομένων διαφόρων τύπων, καθώς και πλατφόρμες νέφους. Αυτή η ποικιλομορφία αποτελεί σημαντική πρόκληση όταν προσπαθούμε να εκτελέσουμε ερωτήματα σε συνδυασ- μένες πηγές δεδομένων με ελάχιστη προσπάθεια και γρήγορη εκτέλεση. H Snapi είναι μια ανοιχτού κώδικα γλώσσα ερωτημάτων που αναπτύχθηκε από τη RAW Labs, η οποία έχει σχεδιαστεί ειδικά για να αντιμετωπίσει αυτό το ζήτημα. Η Snapi επιτρέπει τους χρήστες, να μετασχηματίσουν, συνδυάσουν, συσσωματώσουν δεδομένα σε πραγματικό χρόνο. Για να βελτιώσουμε την απόδοση των ερωτημάτων και να διαχειριστούμε αποτελεσματικά τα ετερογενή σύνολα δεδομένων, υιοθετήσαμε το framework GraalVM/Truffle για την εκτέλεση της Snapi. Αυτή η προσέγγιση δεν επιταχύνει μόνο την επεξεργασία των ερωτημάτων αλλά προσφέρει επίσης μια πιο συντηρήσημη λύση σε σύγκριση με την παραγωγή προσαρ- μοσμένου κώδικα, την οποία θεωρούμε ότι βελτιώνει τη συνολική ανθεκτικότητα του συστήματος. Αυτή η προσέγγιση περιλαμβάνει την παροχή στο Truffle της υλοποίησης γλώσσας Snapi (interpreter) και του Δέντρου Αφηρημένης Σύνταξης του ερωτήματος ως είσοδο. Το Truffle, με τη σειρά του, παράγει έναν υψηλά βελτιστοποιημένο κώδικα που μπορεί να προσαρμοστεί δυναμικά στα συγκεκριμένα δεδομένα που ερωτώνται. Το σύστημα αξιολογείται συγκριτικά με παρόμοια προσέγγιση παραγωγής κώδικα βασισμένες στο JVM. Η εκτέλεση επιταχύνεται έως και 2,5 φορές από την αρχή μέχρι το τέλος (cold start) και έως και 11,5 φορές για δεδομένα των οποίων τα παιδεία μπορούν να έχουν περισσότερους από έναν τύπους.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Βάσεις δεδομένων, Μεταγλωτιστές, Εικονικές μηχανές, Γλώσσες ερωτημάτων
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
5
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
20
Αριθμός σελίδων:
68