Πέργαμος - Βιβλιοθήκη και Κέντρο Πληροφόρησης Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών

Μονάδα:

Κατεύθυνση Ηλεκτρονικός Αυτοματισμός (Η/Α, με πρόσθετη εξειδίκευση στην Πληροφορική και στα πληροφοριακά συστήματα)
Βιβλιοθήκη Σχολής Θετικών Επιστημών

Ημερομηνία κατάθεσης:

2019-09-17

Έτος εκπόνησης:

2019

Συγγραφέας:

Μαυροθαλασσίτης Κυριάκος

Στοιχεία επιβλεπόντων καθηγητών:

Διονύσιος Ρεΐσης, Αναπληρωτής Καθηγητής, Τμήμα Φυσικής, ΕΚΠΑ
Έκτορας Νισταζάκης, Αναπληρωτής Καθηγητής, Τμήμα Φυσικής, ΕΚΠΑ
Δρ Νικόλαος Βλασσόπουλος, Επιστημονικός Συνεργάτης

Πρωτότυπος Τίτλος:

Artificial Intelligence with Reinforcement Learning on Video-Games

Γλώσσες εργασίας:

Αγγλικά

Μεταφρασμένος τίτλος:

Τεχνητή Νοημοσύνη με Reinforcement Learning σε Βίντεο-Παιχνίδια

Περίληψη:

Σκοπός της διπλωματικής εργασίας ήταν η υλοποίηση με λογισμικό ενός συστήματος Τεχνητής Νοημοσύνης (AI) που να μπορεί να μάθει να παίζει βίντεο-παιχνίδια.
Στο πρώτο κεφάλαιο αναπτύχθηκαν περιληπτικά οι τρεις βασικοί τύποι Μηχανικής Μάθησης (ML) και επισημάνθηκε σε ποιον από αυτούς οριοθετείται το δικό μας πρόβλημα.
Στο δεύτερο κεφάλαιο αναπτύχθηκε αναλυτικά η θεωρία στην οποία βασίζονται τα Νευρωνικά Δίκτυα (NN). Συγκεκριμένα αναφέρθηκαν οι νευρώνες του ανθρώπινου εγκεφάλου, οι τεχνητοί νευρώνες Perceptron και Adaline και οι τύποι των Νευρωνικών Δικτύων που μπορούν να κατασκευαστούν από μοντέρνους τεχνητούς νευρώνες. Τέλος αναπτύχθηκαν διεξοδικά τα Συνελικτικά Νευρωνικά Δίκτυα (CNN), καθώς και τα Μακρά Νευρωνικά Δίκτυα Βραχείας Μνήμης (LSTM) που χρησιμοποιήθηκαν κατά κόρον στην εργασία αυτή.
Στο τρίτο κεφάλαιο αναπτύχθηκε η θεωρία της Ενισχυτικής Μάθησης. Συγκεκριμένα συζητήθηκαν οι Διαδικασίες Λήψης Αποφάσεων Markov (MDP), οι εξισώσεις Bellman, οι τύποι συστημάτων που λειτουργούν με Διαδικασίες Λήψης Αποφάσεων Markov και ο τρόπος εκπαίδευσης των συστημάτων Ενισχυτικής Μάθησης. Τέλος, παρουσιάστηκε αναλυτικά ο αλγόριθμος Ενισχυτικής Μάθησης Asynchronous Advantage Actor-Critic (A3C) της Google, που χρησιμοποιήθηκε για την κατασκευή του λογισμικού της εργασίας αυτής.
Στο τέταρτο κεφάλαιο παρουσιάστηκε το παιχνίδι που χρησιμοποιήθηκε στην εκπαίδευση του λογισμικού της εργασίας. Επίσης αναλύθηκαν οι τύποι των Νευρωνικών Δικτύων που χρησιμοποιήθηκαν ως συστατικά για την υλοποίηση του δικού μας συστήματος Τεχνητής Νοημοσύνης.
Στο πέμπτο και τελευταίο κεφάλαιο παρουσιάστηκαν τα πειράματα και τα αποτελέσματα της διαδικασίας εκπαίδευσης του συστήματος.

Κύρια θεματική κατηγορία:

Θετικές Επιστήμες

Λέξεις-κλειδιά:

τεχνητή, νοημοσύνη, ενισχυτική, μάθηση, βίντεο-παιχνίδια

Ευρετήριο:

Όχι

Αρ. σελίδων ευρετηρίου:

Εικονογραφημένη:

Ναι

Αρ. βιβλιογραφικών αναφορών:

Αριθμός σελίδων:

Αρχείο: