Ανίχνευση Ψευδών Ειδήσεων για Covid-19

Διπλωματική Εργασία uoadl:3389221 28 Αναγνώσεις

Μονάδα:
Κατεύθυνση Διαχείριση Δεδομένων, Πληροφορίας και Γνώσης
Πληροφορική
Ημερομηνία κατάθεσης:
2024-02-09
Έτος εκπόνησης:
2024
Συγγραφέας:
Σιαμέτη Οντέτα
Στοιχεία επιβλεπόντων καθηγητών:
Χριστίνα - Καλλιόπη Αλεξανδρή, Καθηγήτρια, Τμήμα Γερμανικής Γλώσσας και Φιλολογίας, ΕΚΠΑ
Πρωτότυπος Τίτλος:
Ανίχνευση Ψευδών Ειδήσεων για Covid-19
Γλώσσες εργασίας:
Ελληνικά
Μεταφρασμένος τίτλος:
Ανίχνευση Ψευδών Ειδήσεων για Covid-19
Περίληψη:
H εξάπλωση της πανδημίας του COVID-19 συνοδεύτηκε από μια εκρηκτική αύξηση και διασπορά των ψευδών ειδήσεων σχετικά με τον ιό. Αρωγός στην διασπορά τους στάθηκε και η εκτεταμένη χρήση των μέσων κοινωνικής δικτύωσης. Οι επιπτώσεις της διασποράς των ψευδών ειδήσεων ήταν πολυάριθμες και πολυεπίπεδες, από την επιβάρυνση των υγειονομικών συστημάτων μέχρι την πρόκληση αναστάτωσης και παραπλάνησης του κοινού. Εξαιτίας αυτής της τάσης, έγινε επιτακτική η ανίχνευση τους. Με την χρήση τεχνολογιών όπως η τεχνητή νοημοσύνη και η μηχανική μάθηση, αναπτύχθηκαν αλγόριθμοι και συστήματα για την αναγνώριση και την κατηγοριοποίηση των ψευδών πληροφοριών.
Στην παρούσα Διπλωματική Εργασία και μελέτη, θα εξεταστούν και θα συγκριθούν τεχνικές, μέθοδοι και αλγόριθμοι μηχανικής και βαθιάς μηχανικής μάθησης, που χρησιμοποιούνται για την ανίχνευση ψευδών ειδήσεων, μέσω της επεξεργασίας φυσικής γλώσσας. Για την επίτευξη του σκοπού της παρούσας εργασίας χρησιμοποιήθηκαν επικεφαλίδες άρθρων, καθώς και αναρτήσεις στα μέσα κοινωνικής δικτύωσης (twitter, Facebook, Instagram, etc.) σχετικές με την Πανδημία. Τα κείμενα που συλλέχθηκαν είναι στην αγγλική γλώσσα και υποβλήθηκαν σε επεξεργασία χρησιμοποιώντας τεχνικές επεξεργασίας φυσικής γλώσσας, με απώτερο σκοπό την κατηγοριοποίησή τους σε ψευδείς ή αληθείς. Η κατηγοριοποίηση πραγματοποιήθηκε με την χρήση αλγορίθμων μηχανικής και βαθιάς μηχανικής μάθησης.
Συγκεκριμένα, χρησιμοποιήθηκαν οι τεχνικές συχνότητας όρων/αντίστροφης συχνότητας όρων (TF-IDF) και ενσωμάτωσης λέξεων (Word2Vec) για την επεξεργασία φυσικής γλώσσας, καθώς και οι αλγόριθμοι Λογιστική Παλινδρόμηση, Πολυωνυμικός αλγόριθμος Naive Bayes, Decision Tree, KNN και το μοντέλο βαθιάς μηχανικής μάθηση (LSTM) για την απόδοση ετικετών (ψευδής ή αληθής) σε κάθε κείμενο.
Για την υλοποίηση της έρευνας χρησιμοποιήθηκε η γλώσσα προγραμματισμού Python.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Επεξεργασία φυσικής γλώσσας, ενσωμάτωση λέξεων,Μηχανική Μάθηση, Βαθιά Μηχανική Μάθηση, αντίστροφη συχνότητα όρων, Λογιστική Παλινδρόμηση, Πολυωνυμικός αλγόριθμος, απόδοση ετικέτας,KNN, Decision Tree, Python
Ευρετήριο:
Όχι
Αρ. σελίδων ευρετηρίου:
0
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
110
Αριθμός σελίδων:
119
CS2180027_Σιαμέτη Οντέτα_Thesis..pdf (4 MB) Άνοιγμα σε νέο παράθυρο