Influence in social networks

Διπλωματική Εργασία uoadl:2874791 342 Αναγνώσεις

Μονάδα:
Κατεύθυνση Ηλεκτρονικός Αυτοματισμός (Η/Α, με πρόσθετη εξειδίκευση στην Πληροφορική και στα πληροφοριακά συστήματα)
Βιβλιοθήκη Σχολής Θετικών Επιστημών
Ημερομηνία κατάθεσης:
2019-05-20
Έτος εκπόνησης:
2019
Συγγραφέας:
Τουργέλης-Προβατάς Ορέστης
Στοιχεία επιβλεπόντων καθηγητών:
Παναγιώτης Σταματόπουλος, Επίκουρος Καθηγητής , Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Ευστάθιος Χατζηευθυμιάδης, Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Ιωάννης Κοτρώνης, Αναπληρωτής Καθηγητής, Τμήμα Πληροφορικής και Τηλεπικοινωνιών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Πρωτότυπος Τίτλος:
Influence in social networks
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Επιρροή στα κοινωνικά δίκτυα
Περίληψη:
Στην εργασία αυτή μελετήσαμε δύο κεντρικά προβλήματα σχετικά με την επιρροή στα κοινωνικά δίκτυα. Το πρώτο είναι το πρόβλημα της μεγιστοποίησης της επιρροής στα κοινωνικά δίκτυα για το οποίο παρουσιάζουμε την μαθηματική θεμελείωση πίσω από τους δύο βασικότερους αλγορίθμους που συναντούμε στη βιβλιογραφία καθώς προχωρούμε και στην υλοποίησή τους. Επίσης
παρουσιάζουμε και δύο βασικά μοντέλα για την διάδοση της επιρροής, το μοντέλο ανεξάρτητης διάδοσης και το μοντέλου γραμμικού κατωφλίου. Η συνάρτηση επιρρής και στα δύο αυτά μοντέλα παρουσιάζει την σημαντική ιδιότητα submodularity το οποίο εξασφαλίζει την αποδοτικότητα του greedy αλγόριθμου.
Το δεύτερο πρόβλημα που μελετήσαμε είναι το πρόβλημα της μάθησης των πιθανοτήτων επιρροής από δεδομένα πραγματικών κοινωνικών δικτύων. Υλοποιήσαμε τους αλγορίθμους που προτείνονται στη βιβλιογραφία τους οποίους χρησιμοποιήσαμε για να υπολογίσουμε της πιθανότητες επιρροής και να αποτιμήσουμε την ακρίβεια πρόβλεψης των διάφορων μοντέλων. Χρειάστηκαν μικρές τροποποιήσεις στους αρχικούς αλγόριθμους για την προσαρμογή τους σε κατευθυνόμενους γράφους. Επίσης δημιουργήσαμε μία βιβλιοθήκη υλοποιημένη σε ruby η οποία μετρατρέπει τα δεδομένα του github archive σε κατάλληλη μορφή αξιοποιήσημη από τους αλγορίθμους. Κατασκευάσαμε λοιπόν ένα καινούργιο σύνολο δεδομένων κατάλληλο για ανάλυση της επιρροής.
Τρέξαμε τους αλγορίθμους για την μάθηση της επιρροής στα δεδομένα των κοινωνικών δικτύων digg και github. Επιβεβαιώσαμε την αποτελεσματικότητα των μοντέλων στην πρόβλεψη της διάδοσης των likes/stars μέσα στο δίκτυο. Ωστόσο σε αντίθεση με την βιβλιογραφία δεν διαπιστώσαμε κάποια βελτίωση με την προσθήκη του χρόνου σαν παράγοντα στην συνάρτηση μοντελοποίησης της πιθανότηταςεπιρροής. Παρατηρήσαμε μία μικρή βελτίωση στην προβλεψιμότητα όταν χρησιμοποιήσαμε μόνο τους χρήστες για τους οποίους είχαμε ενδείξεις επιρροής πάνω από ένα δεδομένο κατώφλι.
Επίσης προτείνουμε μία καινούργια προσέγγιση στον υπολογισμό της πιθανότητας επιρροής εισάγωντας την διακρισή ανάμεσα σε κάποιες ενέργειες των χρηστών. Αντιμετωπίσαμε την ενέργεια της δημιουργίας μιας δημοσίευσης σαν κάτι το οποίο θα είχε διαφορετική επίδραση στους χρήστες από την ενέργεια του “μου αρέσει” σε μία δημοσίευση. Η βελτίωση αυτή δεν ήταν ιδιαίτερα εμφανής στα roc curves που χρησιμοποιούνται στην βιβλιογραφία αλλά ήταν αρκετά εμφανής στα precission recall curves που θεωρούνται καλύτερες για την εκτίμηση της απόδοσης όταν τα δεδομένα μας δεν είναι ισοκατανεμημένα.
Κύρια θεματική κατηγορία:
Θετικές Επιστήμες
Λέξεις-κλειδιά:
Κοινωνικά δίκτυα, μοντέλα διάδοσης της επιρροής, μεγιστοποίηση της επιρροής
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
13
Αριθμός σελίδων:
64