Αναγνώριση Ονομασμένων Οντοτήτων με χρήση Νευρωνικών Δικτύων

Διπλωματική Εργασία uoadl:2899797 11 Αναγνώσεις

Μονάδα:
Κατεύθυνση / ειδίκευση Τεχνολογίες Πληροφορικής και Επικοινωνιών (ΤΠΕ)
Πληροφορική
Ημερομηνία κατάθεσης:
2020-03-25
Έτος εκπόνησης:
2020
Συγγραφέας:
Μόσχου Βασιλική
Στοιχεία επιβλεπόντων καθηγητών:
Μανόλης Κουμπαράκης, Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, ΕΚΠΑ
Πρωτότυπος Τίτλος:
Αναγνώριση Ονομασμένων Οντοτήτων με χρήση Νευρωνικών Δικτύων
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Αναγνώριση Ονομασμένων Οντοτήτων με χρήση Νευρωνικών Δικτύων
Περίληψη:
Με την εξέλιξη της Τεχνητής Νοημοσύνης (ΤΝ), κάθε πτυχή της καθημερινότητας αλλάζει συνεχώς. Πολλοί τομείς του επαγγελματικού κλάδου, προσαρμόζουν συνεχώς τον τρόπο εφαρμογής των υπηρεσιών και προϊόντων τους με χρήση τεχνικών ΤΝ επιτυγχάνοντας πιο αυτοματοποιημένες διαδικασίες, λιγότερα ανθρώπινα σφάλματα, και μεγαλύτερη αποτελεσματικότητα και ακρίβεια. Τέτοιες εφαρμογές υπάρχουν στην εκπαίδευση, στους τρόπους μεταφοράς και μετακίνησης, στην υγεία, στην ψυχαγωγία, αλλά και σε οποιοδήποτε εργαλείο που μπορεί να συμβάλλει στην κοινωνική ζωή και δικτύωση. Τα δεδομένα παίζουν πολύ σημαντικό ρόλο, βοηθώντας τον υπολογιστή να μάθει από το παρελθόν, και να κατανοήσει καλύτερα το παρόν και το μέλλον.
Ο ρόλος της Πολυεπίπεδης ή Βαθιάς Μάθησης εμφανίζεται μαζί με την ανάγκη της αξιοποίησης της γραπτής πληροφορίας και κειμένου, εγγράφων, περιοδικών, και οτιδήποτε γραπτού υπάρχει στο διαδίκτυο. Τα Νευρωνικά Δίκτυα εφαρμόζονται μέσω της βαθιάς μάθησης και αποσκοπούν στην αναγνώριση προτύπων, μέσα από προ-επεξεργασία, ομαδοποίηση, και ταξινόμηση των δεδομένων.

Η Αναγνώριση Ονομασμένων Οντοτήτων αποτελεί μια από τις κύριες μεθόδους που απαιτούνται για την εξαγωγή πληροφοριών, η οποία στοχεύει στον εντοπισμό οντοτήτων μέσα από μη δομημένο κείμενο, και στην μετατροπή της σχετικής πληροφορίας σε συγκεκριμένες προ-δηλωμένες κατηγορίες, όπως για παράδειγμα Άτομο, Τοποθεσία, Οργανισμός και άλλα.

Το εύρος της έρευνας και των αλγορίθμων που έχουν εφαρμοστεί στον συγκεκριμένο κλάδο έχει εξελιχθεί σε τέτοιο βαθμό, που μας δίνει τη δυνατότητα να μελετήσουμε σε βάθος την κάθε εφαρμογή, και να εξάγουμε το καλύτερο δυνατό αποτέλεσμα. Στόχος της διπλωματικής εργασίας, είναι η μελέτη της προόδου που έχει γίνει στην Επεξεργασία Φυσικής Γλώσσας με σκοπό την Αναγνώριση Ονομασμένων Οντοτήτων. Ακολουθώντας ευρέως διαδεδομένα δημοσιεύματα και εφαρμογές, επιχειρούμε να βρούμε την εγκυρότητα των εφαρμοσμένων μοντέλων, τις διαφορές μεταξύ τους, και πως αξιολογείται το τελικό αποτέλεσμα.

Μελετάμε τις τεχνικές της Επεξεργασίας της Φυσικής Γλώσσας, που έχουν εφαρμοστεί για την κοινή έρευνα της Αναγνώρισης Ονομασμένων Οντοτήτων. Θα συγκρίνουμε και θα αποτιμήσουμε state-of-the-art αρχιτεκτονικές Νευρωνικών Δικτύων (LSTM, CNN, RNN, CRF) με σκοπό να αναγνωρίσουμε τους παρακάτω τύπους οντοτήτων: Άτομο, Τοποθεσία, Οργανισμός, Διάφορα (γενικός όρος). Ακόμα θα μελετήσουμε τη σημασία χρήσης ή μη, νέων χαρακτηριστικών μέσα από το σύνολο των δεδομένων, ειδικά εκείνων που δημιουργούνται από το ανθρώπινο χέρι. Για σωστή σύγκριση, χρησιμοποιούμε το ίδιο σύνολο δεδομένων για την εκπαίδευση του μοντέλου, με τον ίδιο τρόπο όπως χρησιμοποιείται και στα αντίστοιχα δημοσιεύματα. Η κάθε προσέγγιση αξιολογείται με βάση τις μετρήσεις ακρίβειας και ανάκλησης του F1-σκορ ανά τύπο οντότητας για κάθε νευρωνικό δίκτυο.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Αναγνώριση Ονομασμένων Οντοτήτων, Παραγωγή Οντοτήτων, Εξαγωγή νέων χαρακτηριστικών, Νευρωνικά Δίκτυα, Πολυεπίπεδη ή βαθιά μάθηση
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
7
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
51
Αριθμός σελίδων:
91
thesis_report_moschou_vasiliki.pdf (1 MB) Άνοιγμα σε νέο παράθυρο