Πέργαμος - Βιβλιοθήκη και Κέντρο Πληροφόρησης Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών

Μονάδα:

Κατεύθυνση Ηλεκτρονικός Αυτοματισμός (Η/Α, με πρόσθετη εξειδίκευση στην Πληροφορική και στα πληροφοριακά συστήματα)
Βιβλιοθήκη Σχολής Θετικών Επιστημών

Ημερομηνία κατάθεσης:

2020-11-20

Έτος εκπόνησης:

2020

Συγγραφέας:

Μανωλάκη Μαρία

Στοιχεία επιβλεπόντων καθηγητών:

Επιβλέπων Καθηγητής Διονύσιος Ρεΐσης, Αναπληρωτής Καθηγητής, Τμήμα Φυσικής, ΕΚΠΑ
Δρ Νικόλαος Βλασσόπουλος, Επιστημονικός Συνεργάτης

Πρωτότυπος Τίτλος:

Development of a Tower Defense game with Reinforcement Learning Agents.

Γλώσσες εργασίας:

Αγγλικά

Μεταφρασμένος τίτλος:

Ανάπτυξη ενός παιχνιδιού Υπεράσπισης Πύργου με πράκτορες Ενισχυτικής Μάθησης.

Περίληψη:

Σκοπός της εργασίας είναι η ανάπτυξη ενός παιχνιδιού Υπεράσπισης Πύργου (Tower Defense) με στοιχεία υπολογιστικής νοημοσύνης. Υλοποιήθηκε μια από τις τεχνικές Βαθιάς Ενισχυτικής Μάθησης (Deep Reinforcement Learning), πιο συγκεκριμένα η Α2C (Advantage Actor-Critic) για να εφοδιάσει τον αντίπαλο (πράκτορα-agent) με στοιχεία τεχνητής νοημοσύνης βοηθώντας τον στην επίτευξη του τελικού στόχου με την αποφυγή των εμποδίων και κινδύνων.
Η εκπαίδευση του αντιπάλου διεξάγεται κατά την διάρκεια του παιχνιδιού. Η μέθοδος A2C εξαιτίας της συνιστώσας Actor-Critic επωφελείται συνδυάζοντας τα χαρακτηριστικά των μεθόδων που βασίζονται στην τιμή της συνάρτησης Q (Q-learning algorithms) και των μεθόδων που βασίζονται στην αναζήτηση της καλύτερης πολιτικής (Policy Search methods). Η χρήση νευρωνικού δικτύου επιτρέπει τον χειρισμό προβλημάτων μεγάλων διαστάσεων εξαιτίας της μείωσης των διαστάσεων που προσφέρει. Η βασική αρχή της εκμάθησης με τεχνικές Ενισχυτικής Μάθησης πηγάζει από την Ψυχολογία συμπεριφοράς και είναι μια γενική μέθοδος που βασίζεται στην αρχή της δοκιμής-και-λάθους. Ο πράκτορας εκπαιδεύεται από μόνος του λαμβάνοντας μηνύματα αμοιβής/τιμωρίας ως απόκριση στις ενέργειές του από το περιβάλλον στο οποίο ο ίδιος δρα.
Η ανάπτυξη του παιχνιδιού χρησίμευσε ως ένα μέσον για την μελέτη και βαθύτερη κατανόηση θεμάτων της βαθιάς ενισχυτικής εκμάθησης. Στην αρχή της εργασίας συζητούνται γενικότερα θέματα Μηχανικής Μάθησης (Machine Learning) και κατόπιν αυτά των Νευρωνικών Δικτύων όπως είναι τα βασικά χαρακτηριστικά, αρχιτεκτονικές και μέθοδοι εκπαίδευσης. Στην συνέχεια αναλύεται το πεδίο της ενισχυτικής μάθησης, όπως είναι οι θεμελιώδεις αρχές, ορισμοί και μεθοδολογικές προσεγγίσεις και τέλος η δραστική βελτίωση που επιτεύχθηκε με την ενσωμάτωση νευρωνικών που οδήγησε στις μεθόδους της βαθιάς ενισχυτικής εκμάθησης.
Ως εργαλεία ανάπτυξης του παιχνιδιού επιλέχθηκαν η γλώσσα Python και συμπληρωματικά τα TensorFlow, Keras και Pygame. Ο συνδυασμός τους ήταν απολύτως επιτυχής για την ανάπτυξη του κώδικα και τα απαραίτητα τρεξίματα για δοκιμή και αξιολόγηση της επίδοσης των αλγορίθμων και ρύθμιση των παραμέτρων. Στο τέλος της εργασίας προτείνονται διάφορες βελτιώσεις των τμημάτων που αφορούν στην επαύξηση της νοημοσύνης των παραγόντων του παιχνιδιού.

Κύρια θεματική κατηγορία:

Θετικές Επιστήμες

Λέξεις-κλειδιά:

Τεχνητή Νοημοσύνη, Ενισχυτική Μάθηση, Παιχνίδι Υπεράσπιση Πύργου

Ευρετήριο:

Όχι

Αρ. σελίδων ευρετηρίου:

Εικονογραφημένη:

Ναι

Αρ. βιβλιογραφικών αναφορών:

Αριθμός σελίδων:

Αρχείο: