Protection of Sensitive Data: Creating, Analyzing and Testing Protocols of Differential Privacy

Πτυχιακή Εργασία uoadl:2958792 474 Αναγνώσεις

Μονάδα:
Τμήμα Πληροφορικής & Τηλεπικοινωνιών
Πληροφορική
Ημερομηνία κατάθεσης:
2021-07-28
Έτος εκπόνησης:
2021
Συγγραφέας:
ΓΑΛΑΝΗΣ ΝΙΚΟΛΑΟΣ
Στοιχεία επιβλεπόντων καθηγητών:
ΚΩΝΣΤΑΝΤΙΝΟΣ ΧΑΤΖΗΚΟΚΟΛΑΚΗΣ, ΑΝΑΠΛΗΡΩΤΗΣ ΚΑΘΗΓΗΤΗΣ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΔΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ, ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ, ΕΚΠΑ7
Πρωτότυπος Τίτλος:
Protection of Sensitive Data: Creating, Analyzing and Testing Protocols of Differential Privacy
Γλώσσες εργασίας:
Αγγλικά
Μεταφρασμένος τίτλος:
Προστασία Ευαίσθητων Δεδομένων: Δημιουργία, Ανάλυση και Δοκιμή Πρωτοκόλλων Διαφορικής Ιδιωτικότητας
Περίληψη:
Το πρόβλημα της διατήρησης της ιδιωτικότητας κατά την ανάλυση δεδομένων,
υφίσταται για πολύ καιρό. Συγκεκριμένα, στην εποχή των big­data,
λεπτομέρειες των χρηστών μπορούν εύκολα να παραβιαστούν από κακόβουλους
χειριστές των δεδομένων, γεγονός που θεωρείται ζήτημα τόσο όσον αφορά την
ασφάλεια, όσο και την προστασία της ιδιωτικότητας του ατόμου.

Mε την υπάρχουσα κατάσταση, υπάρχει η απλή λύση της άρνησης της πρόσβασης
σε δεδομένα χρηστών, στον βωμό της προστασίας τους, κάτι που καθιστά την
εξαγωγή συμπερασμάτων για ποικίλα θέματα αδύνατη. Από την άλλη, ένας
επιτυχημένος μηχανισμός θα ήταν η ελεύθερη διακίνηση των δεδομένων, χωρίς
φιλτράρισμά τους, γεγονός που θα ήταν ωφέλιμο για την πρόοδο των επιστημών
(λόγω του μεγάλου όγκου δεδομένων που θα ήταν διαθέσιμος), αλλά μία μεγάλη
παραβίαση της ιδιωτικότητας των ατόμων.

Ωστόσο, καμία από τις δύο αυτές λύσεις δεν μπορεί να εφαρμοστεί και να μας
βοηθήσει στην επίλυση τους προβλήματός μας. Η απάντηση είναι η εύρεση μίας
ισορροπίας, η οποία ευνοεί και τα δύο μέρη: τους χρήστες και την
ιδιωτικότητά τους, όπως και τους ερευνητές. Η βέλτιστη επίλυση του
θέματος, είναι η Διαφορική Ιδιωτικότητα, που στην πραγματικότητα πρόκειται
για μία υπόσχεση από τον χειριστή των δεδομένων προς τον χρήστη, πως ο
χρήστης δεν θα επηρεαστεί αν επιτρέψει τη χρήση των δεδομένων του σε
κάποια ανάλυση, χωρίς περιορισμούς όπως η παράλληλη ύπαρξη άλλων
μελετών/βάσεων δεδομένων πληροφοριών που υπάρχουν για αυτόν. Παράλληλα, τα
στατιστικά του αποτελέσματος της ανάλυσης, πρέπει να είναι αρκετά ακριβή,
ώστε ο ερευνητής να μπορεί να εξάγει χρήσιμη πληροφορία από αυτά.

Η υπόσχεση αυτή, δείχνει δύσκολα υλοποιήσιμη με την πρώτη ματιά. Παρόλα
αυτά, σε αυτήν την πτυχιακή εργασία, θα ερευνήσουμε με λεπτομέρεια τη
θεωρία που καθιστά εφικτή αυτή τη μορφή ιδιωτικότητας, με την προσθήκη
τυχαίου θορύβου στα δεδομένα. Η Διαφορική Ιδιωτικότητα βασίζεται σε
πιθανοτικές κατανομές, γνωστές ήδη από τον 20o αιώνα, όμως παραμένει μία
νέα τεχνική, η οποία δεν έχει πλήρως υλοποιηθεί με τρόπο τέτοιον ώστε να
μπορεί να χρησιμοποιηθεί από πολλούς ανθρώπους που είναι υπεύθυνοι για την
εξαγωγή δεδομένων.

Σκοπός αυτής της πτυχιακής εργασίας, είναι να μελετήσουμε και να
συγκρίνουμε ήδη υλοποιημένους μηχανισμούς πανω στην Δ.Ι., ενώ παράλληλα θα
δημιουργήσουμε τον δικό μας μηχανισμό, ο οποίος χρησιμοποιείται για τους
σκοπούς της Τοπικής Διαφορικής Ιδιωτικότητας που συναντάται την σήμερον
ημέραν σε αλγορίθμους μηχανικής μάθησης, με στόχο να προστατέψει τα
δεδομένα που αποστέλλουν για εκμάθηση οι χρήστες. Θα το κατορθώσουμε αυτό
δημιουργώντας μία προγραμματιστική βιβλιοθήκη η οποία είναι εύκολη στη
χρήση, ικανοποιώνατας παράλληλα τους κανόνες της προστασίας δεδομένων, και
τέλος θα εξάγουμε συμπεράσματα από τη χρήση της βιβλιοθήκης αυτής.

Κατά την διάρκεια αυτής της εργασίας, θα πραγματοποιηθούν πολλές
μετρήσεις, με στόχο να γίνει πειστική η χρησιμότητα και η
αποτελεσματικότητα της Διαφορικής Ιδιωτικότητας.
Κύρια θεματική κατηγορία:
Τεχνολογία – Πληροφορική
Λέξεις-κλειδιά:
Διαφορική Ιδιωτικότητα, Ασφάλεια, Δεδομένα Χρηστών, Προστασία Δεδομένων, Θόρυβος σε Δεδομένα, Συλλογή Δεδομένων
Ευρετήριο:
Ναι
Αρ. σελίδων ευρετηρίου:
5
Εικονογραφημένη:
Ναι
Αρ. βιβλιογραφικών αναφορών:
17
Αριθμός σελίδων:
65