Identifying depression in Greek Twitter

Διδακτορική Διατριβή uoadl:3364547 68 Αναγνώσεις

Μονάδα:
Τμήμα Φιλολογίας
Βιβλιοθήκη Φιλοσοφικής Σχολής
Ημερομηνία κατάθεσης:
2023-11-13
Έτος εκπόνησης:
2023
Συγγραφέας:
Στάμου Ακριβή
Στοιχεία επταμελούς επιτροπής:
Σπυριδούλα Βαρλοκώστα, Καθηγήτρια, Τμήμα Φιλολογίας, ΕΚΠΑ
Γεώργιος Μικρός, Πανεπιστήμιο Hamad Bid Khalifa (HBKU), Κατάρ, Καθηγητής
Γεώργιος Μαρκόπουλος, Αναπληρωτής Καθηγητής, Τμήμα Φιλολογίας, ΕΚΠΑ
Χριστίνα Αλεξανδρή, Καθηγήτρια, Τμήμα Γερμανικής Γλώσσας και Φιλολογίας, ΕΚΠΑ
Μαρία Ιακώβου, Αναπληρώτρια Καθηγήτρια , Τμήμα Φιλολοφίας, ΕΚΠΑ
Στυλιανή Μαρκαντωνάτου, Ινστιτούτο Επεξεργασίας Λόγου, Ερευνητικό Κέντρο «Αθηνά», Ερευνήτρια Α’
Αλέξανδρος Τάντος, Επίκουρος Καθηγητής, Τμήμα Φιλολοφίας, ΑΠΘ
Πρωτότυπος Τίτλος:
Identifying depression in Greek Twitter
Γλώσσες διατριβής:
Αγγλικά
Μεταφρασμένος τίτλος:
Εντοπίζοντας την κατάθλιψη στο Ελληνικό Twitter
Περίληψη:
Το θέμα της παρούσας διδακτορικής μελέτης είναι η ανίχνευση της κλινικής κατάθλιψης στη Νέα Ελληνική γλώσσα αναλύοντας δεδομένα χρηστών που χρησιμοποιούν την πλατφόρμα κοινωνικής δικτύωσης Twitter. Σύμφωνα με την Αμερικανική Ψυχιατρική Ένωση η κατάθλιψη είναι μία ψυχική διαταραχή που επηρεάζει έναν στους δεκαπέντε ενηλίκους (6.7%), ενώ επιπλέον γύρω στο 16.6% των ανθρώπων βιώνουν κατάθλιψη κάποια χρονική στιγμή της ζωής τους. Ωστόσο, σε αρκετές περιπτώσεις οι ασθενείς δεν έχουν επίγνωση της ψυχολογικής τους κατάστασης, όπως για παράδειγμα οι έφηβοι μεταξύ 12-17 χρόνων (περίπου 77 σύμφωνα με τον Schiller et al., 2013). Στις παραδοσιακές μεθόδους διάγνωσης της κατάθλιψης εμπεριέχονται τα ερωτηματολόγια και οι ατομικές εξετάσεις που είναι χρονοβόρες, δαπανηρές και εξαρτώνται από την επιθυμία και ευαισθητοποίηση του εκάστοτε προσώπου.

Πρόσφατες μελέτες στο πλαίσιο Κοινών Εργασιών της Υπολογιστικής Γλωσσολογίας και Κλινικής Ψυχολογίας (Coppersmith et al., 2015) χρησιμοποίησαν δεδομένα χρηστών κοινωνικής δικτύωσης, οι οποίοι διαγνώστηκαν με κατάθλιψη, ενώ εφήρμοσαν διάφορες μεθόδους με απώτερο στόχο την δημιουργία μοντέλων αναγνώρισης της κατάθλιψης. Η πλειονότητα των μελετών βασίζεται σε παρατηρήσεις που έχουν γίνει για την Αγγλική γλώσσα και αποσκοπεί στον εντοπισμό διαφοροποιητικών χαρακτηριστικών μεταξύ καταθλιπτικών και νευροτυπικών ατόμων. Συγκεκριμένα, οι περισσότερες έρευνες περιστρέφονται γύρω από τρεις άξονες σε σχέση με τον τρόπο ανίχνευσης: (i) σε μεθόδους ανίχνευσης συναισθημάτων (Schwartz et al, 2014.), (ii) σε μεθόδους χρήσης γλωσσικών δεικτών, για παράδειγμα με τη χρήση του LIWC λεξικού (Pennebaker et al., 1999) ή μοντέλων ν-γραμμάτων (Coppersmith et al., 2015; Mitchell et al., 2015), και (iii) σε μεθόδους εντοπισμού θεμάτων (Resnik et al., 2013).

Ο ρόλος της γλώσσας στην διάκριση των ψυχολογικών καταστάσεων έχει προταθεί ήδη από τη δεκαετία του 1960 με την μέθοδο Gottschalk (Gottschalk & Gleser, 1969), σύμφωνα με την οποία τα λεξικά χαρακτηριστικά δύνανται να αποκαλύψουν το μέγεθος διάφορων ψυχολογικών διαστάσεων, όπως το άγχος ή η κοινωνική αποξένωση. Τα χαρακτηριστικά διακρίνονται σε δύο είδη: (i) στα εξωγλωσσικά χαρακτηριστικά, όπως για παράδειγμα η συχνότητα των ποστ, το ποσοστό αναδημοσιεύσεων, ο αριθμός ακολούθων, οι δημογραφικές πληροφορίες των χρηστών κ.α. και (ii) στα γλωσσικά χαρακτηριστικά, όπως η χρήση λέξεων αρνητικής συναισθηματικής φόρτισης (De Choudhury et al., 2013a). Με τους μεν πρώτους δείκτες επιχειρείται η αποτύπωση και ποσοτικοποίηση του παράγοντα της κοινωνικής αλληλεπίδρασης, με τους δε γλωσσικούς δείκτες είναι δυνατόν να καταγραφεί και να σκιαγραφηθεί τόσο ο τρόπος έκφρασης των καταθλιπτικών ασθενών (π.χ. συχνή χρήση του α’ προσώπου των προσωπικών αντωνυμιών), όσο και το περιεχόμενο των συζητήσεων/θεμάτων που τους απασχολούν (π.χ. αυξημένο ενδιαφέρον για ιατρικά θέματα και θρησκευτικά δρώμενα).

Η συνεισφορά της εργασίας αυτής έγκειται στην προσπάθεια προσαρμογής των μεθόδων που απαιτούνται, προκειμένου να εντοπιστεί η κατάθλιψη μέσω της παρατήρησης γλωσσικών χαρακτηριστικών στην Νέα Ελληνική. Για το σκοπό αυτό δημιουργήσαμε ένα σώμα κειμένων για την κατάθλιψη, το οποίο βασίζεται σε αυτοαναφορές χρηστών. Επιπλέον, συλλέξαμε δύο σώματα κειμένων για τους νευροτυπικούς χρήστες με δύο τρόπους: (i) βάσει τυχαίας επιλογής και (ii) βάσει αναλογίας των θεμάτων. Εν συνεχεία, δοκιμάσαμε και συγκρίναμε διάφορους στατιστικούς ταξινομητές, αλλά και νευρωνικά δίκτυα προκειμένου να εντοπίσουμε τόσο την ύπαρξη ιδιαίτερων γλωσσικών δεικτών, αλλά και για να δημιουργήσουμε ένα πρώτο μοντέλο αναφοράς ανίχνευσης της κατάθλιψης για την Νέα Ελληνική γλώσσα. Ακόμα, στο πλαίσιο αυτό προσαρμόσαμε το εργαλείο LIWC στα Ελληνικά. Παράλληλα, εστιάσαμε στις ιδιαιτερότητες αντιστοίχισης της Ελληνικής εκδοχής, καθώς επίσης την αξιολογήσαμε τόσο ως προς την επάρκεια του λεξικού, τρέχοντάς το λεξικό σε παράλληλα σώματα κειμένων, όσο και ως προς την δυνατότητα πρόβλεψης των LIWC-κατηγοριών, εφαρμόζοντάς το σε σώματα κειμένων καταθλιπτικού λόγου. Επιπλέον, συγκρίναμε δύο τύπους χαρακτηριστικών: χαρακτηριστικά TFIDF και χαρακτηριστικά LIWC, και αναλύσαμε τη σημασία τους στην απόδοση των μοντέλων.

Συνοψίζοντας, η μελέτη μας εντοπίζει συγκεκριμένους γλωσσικούς δείκτες που σχετίζονται με την κατάθλιψη, οι οποίοι περιλαμβάνουν αυξημένη χρήση προσωπικών αντωνυμιών στο πρώτο πρόσωπο ενικού αριθμού, κυριαρχία του συναισθήματος της θλίψης, αυξημένο ενδιαφέρον για θέματα που σχετίζονται με την υγεία, μειωμένη συμμετοχή σε δραστηριότητες που σχετίζονται με την εργασία, μειωμένα κίνητρα που συνοδεύονται από χαμηλές προσδοκίες επιτυχίας και συχνές αναφορές σε γεγονότα που αφορούν τον Ενεστώτα χρόνο. Η παρούσα διδακτορική μελέτη αποτελεί μία βάση για τη διερεύνηση της κατάθλιψης στην Νέα Ελληνική Γλώσσα. Μελλοντικά θα ήταν δυνατό να δημιουργηθεί ένα εργαλείο που θα μπορούσε να λειτουργήσει ως αφετηρία διάγνωσης των ατόμων που πάσχουν από κατάθλιψη στα πρώτα στάδια εμφάνισής της. Επιπρόσθετα, τα τρέχοντα μοντέλα, θα μπορούσαν να χρησιμοποιηθούν ως αναφορά και να αξιολογηθούν έναντι δεδομένων που προέρχονται από επίσημα διαγνωσμένους καταθλιπτικούς ασθενείς.
Κύρια θεματική κατηγορία:
Γλώσσα – Λογοτεχνία
Λέξεις-κλειδιά:
κατάθλιψη, γλωσσικοί δείκτες, Νέα Ελληνική γλώσσα, μέσα κοινωνικής δικτύωσης
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
224
Αριθμός σελίδων:
175
Αρχείο:
Δεν επιτρέπεται η πρόσβαση στο αρχείο έως 2026-06-18.

Phd_Stamou_Depression_Detection_MG.pdf
3 MB
Δεν επιτρέπεται η πρόσβαση στο αρχείο έως 2026-06-18.