Event Detection in Twitter: An Experimental Comparison

Πτυχιακή Εργασία uoadl:1705247 809 Αναγνώσεις

Μονάδα:
Τμήμα Πληροφορικής & Τηλεπικοινωνιών
Πληροφορική
Ημερομηνία κατάθεσης:
2017-07-06
Έτος εκπόνησης:
2017
Συγγραφέας:
ΣΙΟΥΛΑΣ ΠΑΝΑΓΙΩΤΗΣ
ΤΣΙΤΣΙΜΠΙΚΟΣ ΚΩΝΣΤΑΝΤΙΝΟΣ
Στοιχεία επιβλεπόντων καθηγητών:
Γουνόπουλος Δημήτριος, Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
Event Detection in Twitter: An Experimental Comparison
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Ανίχνευση Γεγονότων στο Twitter: Μια Πειραματική Σύγκριση
Περίληψη:
Η πρόσφατη ανάδειξη των κοινωνικών δικτύων και ειδικότερα του Twitter έφερε ως αποτέλεσμα δεδομένα πρωτοφανούς μεγέθους για το περιεχόμενο και τις αλληλεπιδράσεις που παράγουν οι χρήστες στο πλαίσιο αυτό. Αυτή η πληροφορία μπορεί να αξιοποιηθεί για πλήθος εφαρμογών, μια από τις οποίες είναι και η ανίχνευση γεγονότων δηλαδή ο καθορισμός ενός χρονικού διαστήματος και ενός συνόλου εγγραφών περιεχομένου που σχετίζονται με ένα γεγονός στον πραγματικό κόσμο.
Στην εργασία αυτή, υλοποιούμε ένα αρθρωτό σύστημα ανίχνευσης γεγονότων που λειτουργεί εκ των υστέρων πάνω σε μια συλλογή από ιστορικά δεδομένα του Twitter και επιτελεί την διαδικασία σε διακριτά στάδια μιας σωλήνωσης με τέσσερα βήματα, την προεπεξεργασία, την μοντελοποίηση θεμάτων, την χρονική διαμέριση και την μεταεπεξεργασία. Στο στάδιο της μοντελοποίησης θεμάτων δοκιμάζουμε δυο διαφορετικούς αλγόριθμους μοντελοποίησης, το LDA και το CTM και για τις δυο εκδοχές του συστήματος που προκύπτουν διεξάγουμε μια πειραματική σύγκριση της απόδοσης του συστήματος. Στη σύγκριση λαμβάνονται υπόψη τόσο τα τελικά αποτελέσματα του αλγορίθμου ανίχνευσης γεγονότων όσο και τα ενδιάμεσα αποτελέσματα των θεμάτων που παράγει το μοντέλο. Από τη μια μεριά, το CTM φαίνεται να έχει καλύτερες δυνατότητες πρόβλεψης ως μοντέλο σε επίπεδο θεμάτων. Από την άλλη, σε επίπεδο γεγονότων το CTM φαίνεται να υστερεί στην ανίχνευση μικρότερων γεγονότων σε σχέση με το LDA αλλά κάνει ακριβέστερη ανάλυση σε υπογεγονότα των μεγαλύτερων γεγονότων. Συνεπώς, η επιλογή του μοντέλου αποτελεί ένα αντάλλαγμα μεταξύ διαφορετικών στόχων της ανίχνευσης.
Κύρια θεματική κατηγορία:
Πληροφορική
Λέξεις-κλειδιά:
γεγονότα, ανίχνευση, LDA, CTM, συσταδοποίηση, χρονικό μοντέλο
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
4
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
10
Αριθμός σελίδων:
28