Προσδιορισμός συγγραφικού προφίλ μέσω τεχνικών επεξεργασίας φυσικής γλώσσας

Διδακτορική Διατριβή uoadl:2960055 79 Αναγνώσεις

Μονάδα:
Τμήμα Φιλολογίας
Βιβλιοθήκη Φιλοσοφικής Σχολής
Ημερομηνία κατάθεσης:
2021-09-15
Έτος εκπόνησης:
2021
Συγγραφέας:
Γαγιάτσου Σοφία
Στοιχεία επταμελούς επιτροπής:
Μαρκόπουλος Γεώργιος, Αναπληρωτής Καθηγητής, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Μικρός Γεώργιος, Καθηγητής, College of Humanities and Social Sciences του Πανεπιστημίου Hamad Bin Khalifa, Κατάρ
Γούτσος Διονύσιος, Καθηγητής, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Ιακώβου Μαρία, Αναπληρώτρια Καθηγήτρια, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Μπέλλα Σπυριδούλα, Καθηγήτρια, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Λέγγερης Άγγελος, Επίκουρος Καθηγητής, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Παναρέτου Ελένη, Αναπληρώτρια Καθηγήτρια, Τμήμα Φιλολογίας, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
Προσδιορισμός συγγραφικού προφίλ μέσω τεχνικών επεξεργασίας φυσικής γλώσσας
Γλώσσες διατριβής:
Ελληνικά
Μεταφρασμένος τίτλος:
Προσδιορισμός συγγραφικού προφίλ μέσω τεχνικών επεξεργασίας φυσικής γλώσσας
Περίληψη:
Η παρούσα διατριβή παρουσιάζει την ερευνητική προσπάθεια και τα αποτελέσματα που αυτή παρήγαγε αναφορικά με την αυτόματη αναγνώριση των χαρακτηριστικών της προσωπικότητας του συγγραφέα μέσω τεχνικών επεξεργασίας φυσικής γλώσσας. Συγκεκριμένα, εξετάζεται η υπόθεση ότι στοιχεία του χαρακτήρα ενός ατόμου μπορούν να προσδιοριστούν αυτόματα μέσω της γλώσσας που χρησιμοποιεί στο γραπτό του λόγο. Για το σκοπό αυτό αναπτύχθηκε ηλεκτρονικό σώμα κειμένων από εκθέσεις μαθητών Λυκείου στην Ελληνική γλώσσα. Στους συμμετέχοντες μαθητές χορηγήθηκαν δύο ερωτηματολόγια προσωπικότητας, το ένα βασισμένο στην τυπολογία του Carl Jung και το άλλο στο μοντέλο των Πέντε Παραγόντων (ψυχολογικών χαρακτηριστικών). Επιπλέον, καταγράφεται στην παρούσα διατριβή αναλυτική επισκόπηση της διεθνούς βιβλιογραφίας του εν λόγω ερευνητικού πεδίου, ώστε να μελετηθούν η μεθοδολογία, τα εργαλεία και τα αποτελέσματα των σχετικών ερευνών μέχρι σήμερα. Αξιοποιώντας τα σύγχρονα ερευνητικά πορίσματα, η διατριβή εξετάζει την αποτελεσματικότητα δεκάδων υφομετρικών χαρακτηριστικών για την πρόβλεψη της προσωπικότητας των μαθητών. Αυτά τα χαρακτηριστικά, αφού εξήχθησαν αυτόματα από τα ηλεκτρονικά κειμενικά σώματα των εκθέσεων με εργαλεία και πόρους επεξεργασίας φυσικής γλώσσας, τροφοδότησαν μια μεγάλη σειρά από αλγόριθμους μηχανικής μάθησης, των οποίων τα μοντέλα ελέγχθηκαν μετά ως προς την ακρίβεια της απόδοσής τους. Για το Ερωτηματολόγιο Τύπων Προσωπικότητας Myers-Briggs Type Indicator (ΜΒΤΙ) βρέθηκε ότι ο Naive Bayes αλγόριθμος αποδίδει το μεγαλύτερο συγκριτικά κατά μέσο όρο ποσοστό ακρίβειας, ανερχόμενο σε 76,5%, ενώ για την πρόβλεψη των χαρακτηριστικών προσωπικότητας βάσει του μοντέλου των Πέντε Παραγόντων, επικράτησε ο αλγόριθμος Generalized Linear Model με μέσο όρο ακρίβειας 72,2%. Από την διεξαχθείσα έρευνα προέκυψαν νέοι συνδυασμοί υφομετρικών χαρακτηριστικών και αντίστοιχες υπολογιστικές τεχνικές, που δίνουν ενδιαφέρουσες και ικανοποιητικές λύσεις στο πρόβλημα αυτόματης αναγνώρισης της προσωπικότητας του συγγραφέα για την Ελληνική γλώσσα, ενώ καταδείχθηκε (και για τα Ελληνικά) η βαρύνουσα αξία της χρήσης των υφομετρικών γλωσσολογικών χαρακτηριστικών στην αντιμετώπιση των ερευνητικών προβλημάτων στο γενικότερο επιστημονικό και τεχνολογικό πεδίο της κατανόησης από τον υπολογιστή του ανθρώπινου γραπτού λόγου, με έμφαση στην επεξεργασία κειμένων φυσικής γλώσσας για αυτόματη εξόρυξη ιδιαίτερων χαρακτηριστικών του συγγραφέα τους.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
πρόβλεψη προσωπικότητας, τυπολογία Jung, μοντέλο Πέντε Παραγόντων, υπολογιστική υφομετρία, υφομετρικά χαρακτηριστικά, μηχανική μάθηση
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
240
Αριθμός σελίδων:
259
Διδακτορική Διατριβή_Γαγιάτσου Σοφία.pdf (4 MB) Άνοιγμα σε νέο παράθυρο