Υβριδική υλοποίηση σε CUDA και OpenMP για την επίλυση της εξίσωσης διάχυσης θερμότητας με χρήση της τοπικής Τροποποιημένης μεθόδου SOR

Διπλωματική Εργασία uoadl:1320502 258 Αναγνώσεις

Μονάδα:
Κατεύθυνση Ηλεκτρονικός Αυτοματισμός (Η/Α, με πρόσθετη εξειδίκευση στην Πληροφορική και στα πληροφοριακά συστήματα)
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2014-11-05
Έτος εκπόνησης:
2014
Συγγραφέας:
Γιαννακόπουλος Πέτρος
Στοιχεία επιβλεπόντων καθηγητών:
Ιωάννης Κοτρώνης Επίκ. Καθηγητής
Πρωτότυπος Τίτλος:
Υβριδική υλοποίηση σε CUDA και OpenMP για την επίλυση της εξίσωσης διάχυσης θερμότητας με χρήση της τοπικής Τροποποιημένης μεθόδου SOR
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
Hybrid implementation in CUDA and OpenMP for the solution of the convection diffusion equation with the local Modified SOR method
Περίληψη:
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η υβριδική παράλληλη
υλοποίηση της μεθόδου SOR για την αριθμητική επίλυση της Εξίσωσης Διάχυσης
Θερμότητας που θα εκμεταλλεύεται τη CPU και τη GPU για την επιτάχυνση του
χρόνου επίλυσης, με χρήση υβριδικού OpenMP – CUDA κώδικα. Αφετηρία είναι δύο
προυπάρχουσες ξεχωριστές υλοποιήσεις της LMSOR, σε OpenMP και CUDA, με χρήση
διάταξης κόκκινων και μαύρων σημείων (red-black ordering) και χρήση 2 συνόλων
παραμέτρων ωij και ω2ij για το stencil 5 σημείων. Οι γραμμές του πλέγματος
διαμοιράζονται με στατικό τρόπο σε CPU και GPU και καθεμία πραγματοποιεί τους
υπολογισμούς στο δικό της κομμάτι με ανταλλαγή των συνοριακών γραμμών και
υπολογισμό της ολικής σύγκλισης σε κάθε επανάληψη. H υλοποίηση για CPU (ΟpenMP)
χρησιμοποιεί και τις επεκτάσεις SSE2, κάτι που ενσωματώθηκε και στην υβριδική
υλοποίηση για το μέρος των υπολογισμών που πραγματοποιούνται στη CPU. Για τις
γραμμές του πλέγματος που υπολογίζονται στη GPU έχουν υλοποιηθεί 3
διαφοροποιήσεις των πυρήνων (kernels) για χρήση κύριας (global), κοινής
(shared) ή μνήμης υφής (texture memory), σύμφωνα και με την αρχική υλοποίηση
μόνο για GPU. H επίδοση που επιτεύχθηκε για τους υπολογισμούς με την υβριδική
υλοποίηση ήταν, για μεγάλα και μεσαίου μεγέθους προβλήματα, ικανοποιητική και
πολύ κοντά στην αθροιστική επίδοση των αρχικών υλοποιήσεων μόνο για GPU και
CPU.
Λέξεις-κλειδιά:
Επαναληπτικές μέθοδοι, Υβριδική υλοποίηση OpenMP-CUDA, Επεκτάσεις SSE2, Υπολογισμοί με GPU, Μέθοδος διαδοχικής Υπερομαλοποίησης
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
7-8
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
8
Αριθμός σελίδων:
41