Autotuning InfluxDB with Regression Techniques

Διπλωματική Εργασία uoadl:3390965 42 Αναγνώσεις

Μονάδα:
Κατεύθυνση Διαχείριση Δεδομένων, Πληροφορίας και Γνώσης
Πληροφορική
Ημερομηνία κατάθεσης:
2024-03-01
Έτος εκπόνησης:
2024
Συγγραφέας:
Καραγεώργου Ιωάννα
Στοιχεία επιβλεπόντων καθηγητών:
Αλέξης Δελής Καθηγητής ΕΚΠΑ
Πρωτότυπος Τίτλος:
Autotuning InfluxDB with Regression Techniques
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
IΑυτόματη ρύθμιση της InfluxDB με τεχνικές παλινδρόμησης
Περίληψη:
Στο σημερινό τοπίο που κυριαρχείται από τα δεδομένα,
η απόδοση των συστημάτων βάσεων δεδομένων
διαδραματίζει κρίσιμο ρόλο στη λειτουργία
πολλών εφαρμογών και υπηρεσιών.
Καθώς οι όγκοι δεδομένων συνεχίζουν
να αυξάνονται με ασύγκριτους ρυθμούς,
η βελτιστοποίηση της απόδοσης των βάσεων δεδομένων
έχει γίνει ανησυχία πολλών οργανισμών σε διάφορους τομείς.
Αυτή η διπλωματική επικεντρώνεται
στην περίπλοκη εργασία της βελτίωσης
της απόδοσης της χρονοσειριακής βάσης δεδομένων InfluxDB.
Ο κύριος στόχος αυτής της έρευνας
είναι να παράσχει ένα συστηματικό τρόπο
για τη ρύθμιση των παραμέτρων διαμόρφωσης της InfluxDB
με σκοπό τη βελτίωση της απόδοσης των ερωτημάτων.
Σκοπός μας είναι να ανακαλύψουμε πληροφορίες
που μπορούν να εφαρμο-\\στούν εύκολα από
διαχειριστές βάσεων δεδομένων, χειριστές και οργανισμούς
προκει-\\μένου να αποσπάσουν την καλύτερη δυνατή απόδοση
από τις εγκαταστάσεις της InfluxDB.
Το θεμέλιο αυτής της μελέτης αποτελεί
μια εκτενής εξέταση της επίδρασης τεσσάρων παραμέτρων διαμόρφωσης
και του πώς επηρεάζουν τα ποσοστά των ερωτημάτων,\\
καθιστώντας τη λεπτομερή ρύθμισή τους μια πρόκληση.
Αρχικά η προσέγγισή μας περιλα-\\μβάνει τη χρήση ενός
μοντέλου μηχανικής μάθησης για να προβλέψουμε ποσοστά ερωτη-\\μάτων
με διάφορες τιμές στις παραμέτρους της InfluxDB.
Στη συνέχεια, επικυρώνουμε αυτές τις προβλέψεις
μέσω πρακτικών πειραμάτων υπό διάφορα φορτία εργασίας στη βάση.
Τα ευρήματά μας προκαλούν συμβατικές υποθέσεις,
τονίζοντας την απαιτική εργασία της ρύθμισης βάσεων δεδομένων.
Για παράδειγμα, παρατηρούμε ότι μικρότερες τιμές μνήμης
μπορούν να αποδίδουν καλύτερα από μεγαλύτερες τιμές,
υπογραμμίζοντας τη σημασία των πειραματικών δοκιμών.
Η αξιολόγησή μας για την προεπιλεγμένη τιμή
της παραμέτρου "cache-snapshot-memory-size"
δείχνει την ευρωστία των προεπιλεγμένων ρυθμίσεων
της InfluxDB, καθώς καμία από τις προσαρμογές
στην παράμετρο δεν απέδοσε καλύτερα
από την προεπιλεγμένη ρύθμιση.
Αυτή η έρευνα φωτίζει την περίπλοκη σχέση
μεταξύ των παραμέτρων της βάσης δεδομένων
και των φορτίων εργασιών μιας βάσης πραγματικού κόσμου,
παρέχοντας πολύτιμες εισηγήσεις για τη βελτίωση της απόδοσης.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
influxdb, παράμετροι, μηχανική μάθηση, benchmark
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
2
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
21
Αριθμός σελίδων:
70
Αρχείο:
Δεν επιτρέπεται η πρόσβαση στο αρχείο. H πρόσβαση επιτρέπεται μόνο εντός του δικτύου του ΕΚΠΑ.

Master_Thesis.pdf
872 KB
Δεν επιτρέπεται η πρόσβαση στο αρχείο. H πρόσβαση επιτρέπεται μόνο εντός του δικτύου του ΕΚΠΑ.