1. Η έννοια της Απόκρυψης Δεδομένων
Η κάλυψη δεδομένων είναι επίσης γνωστή ως κάλυψη δεδομένων. Είναι μια τεχνική μέθοδος μετατροπής, τροποποίησης ή κάλυψης ευαίσθητων δεδομένων, όπως αριθμός κινητού τηλεφώνου, αριθμός τραπεζικής κάρτας και άλλες πληροφορίες, όταν έχουμε δώσει κανόνες και πολιτικές κάλυψης. Αυτή η τεχνική χρησιμοποιείται κυρίως για να αποτρέψει την απευθείας χρήση ευαίσθητων δεδομένων σε αναξιόπιστα περιβάλλοντα.
Αρχή της απόκρυψης δεδομένων: Η απόκρυψη δεδομένων θα πρέπει να διατηρεί τα αρχικά χαρακτηριστικά δεδομένων, τους επιχειρηματικούς κανόνες και τη συνάφεια των δεδομένων για να διασφαλιστεί ότι η επακόλουθη ανάπτυξη, δοκιμή και ανάλυση δεδομένων δεν θα επηρεαστεί από την απόκρυψη. Εξασφαλίστε τη συνέπεια και την εγκυρότητα των δεδομένων πριν και μετά την κάλυψη.
2. Ταξινόμηση συγκάλυψης δεδομένων
Η κάλυψη δεδομένων μπορεί να χωριστεί σε στατική κάλυψη δεδομένων (SDM) και δυναμική κάλυψη δεδομένων (DDM).
Στατική κάλυψη δεδομένων (SDM): Η στατική κάλυψη δεδομένων απαιτεί τη δημιουργία μιας νέας βάσης δεδομένων μη παραγωγικού περιβάλλοντος για απομόνωση από το περιβάλλον παραγωγής. Τα ευαίσθητα δεδομένα εξάγονται από τη βάση δεδομένων παραγωγής και στη συνέχεια αποθηκεύονται στη μη παραγωγική βάση δεδομένων. Με αυτόν τον τρόπο, τα απευαισθητοποιημένα δεδομένα απομονώνονται από το περιβάλλον παραγωγής, το οποίο καλύπτει τις επιχειρηματικές ανάγκες και διασφαλίζει την ασφάλεια των δεδομένων παραγωγής.
Δυναμική κάλυψη δεδομένων (DDM): Χρησιμοποιείται γενικά στο περιβάλλον παραγωγής για την απευαισθητοποίηση ευαίσθητων δεδομένων σε πραγματικό χρόνο. Μερικές φορές, απαιτούνται διαφορετικά επίπεδα κάλυψης για την ανάγνωση των ίδιων ευαίσθητων δεδομένων σε διαφορετικές καταστάσεις. Για παράδειγμα, διαφορετικοί ρόλοι και δικαιώματα ενδέχεται να υλοποιούν διαφορετικά σχήματα κάλυψης.
Εφαρμογή αναφοράς δεδομένων και κάλυψης προϊόντων δεδομένων
Τέτοια σενάρια περιλαμβάνουν κυρίως προϊόντα εσωτερικής παρακολούθησης δεδομένων ή πινακίδες, προϊόντα δεδομένων εξωτερικών υπηρεσιών και αναφορές που βασίζονται σε ανάλυση δεδομένων, όπως επιχειρηματικές αναφορές και αναθεώρηση έργων.
3. Λύση κάλυψης δεδομένων
Τα κοινά σχήματα κάλυψης δεδομένων περιλαμβάνουν: ακύρωση, τυχαία τιμή, αντικατάσταση δεδομένων, συμμετρική κρυπτογράφηση, μέση τιμή, μετατόπιση και στρογγυλοποίηση κ.λπ.
Ακύρωση: Η ακύρωση αναφέρεται στην κρυπτογράφηση, περικοπή ή απόκρυψη ευαίσθητων δεδομένων. Αυτό το σχήμα συνήθως αντικαθιστά τα πραγματικά δεδομένα με ειδικά σύμβολα (όπως *). Η λειτουργία είναι απλή, αλλά οι χρήστες δεν μπορούν να γνωρίζουν τη μορφή των αρχικών δεδομένων, γεγονός που μπορεί να επηρεάσει τις επόμενες εφαρμογές δεδομένων.
Τυχαία τιμή: Η τυχαία τιμή αναφέρεται στην τυχαία αντικατάσταση ευαίσθητων δεδομένων (οι αριθμοί αντικαθιστούν τα ψηφία, τα γράμματα αντικαθιστούν τα γράμματα και οι χαρακτήρες αντικαθιστούν χαρακτήρες). Αυτή η μέθοδος κάλυψης θα εξασφαλίσει τη μορφή των ευαίσθητων δεδομένων σε κάποιο βαθμό και θα διευκολύνει την επακόλουθη εφαρμογή δεδομένων. Μπορεί να χρειαστούν λεξικά κάλυψης για ορισμένες λέξεις με νόημα, όπως ονόματα ανθρώπων και τοποθεσιών.
Αντικατάσταση δεδομένων: Η αντικατάσταση δεδομένων είναι παρόμοια με την κάλυψη μηδενικών και τυχαίων τιμών, με τη διαφορά ότι αντί να χρησιμοποιηθούν ειδικοί χαρακτήρες ή τυχαίες τιμές, τα δεδομένα κάλυψης αντικαθίστανται με μια συγκεκριμένη τιμή.
Συμμετρική κρυπτογράφηση: Η συμμετρική κρυπτογράφηση είναι μια ειδική αναστρέψιμη μέθοδος κάλυψης. Κρυπτογραφεί ευαίσθητα δεδομένα μέσω κλειδιών κρυπτογράφησης και αλγορίθμων. Η μορφή κρυπτογραφημένου κειμένου είναι συνεπής με τα αρχικά δεδομένα σε λογικούς κανόνες.
Μέσος: Το μέσο σχήμα χρησιμοποιείται συχνά σε στατιστικά σενάρια. Για τα αριθμητικά δεδομένα, υπολογίζουμε πρώτα τον μέσο όρο τους και, στη συνέχεια, κατανέμουμε τυχαία τις απευαισθητοποιημένες τιμές γύρω από το μέσο όρο, διατηρώντας έτσι το άθροισμα των δεδομένων σταθερό.
Μετατόπιση και στρογγυλοποίηση: Αυτή η μέθοδος αλλάζει τα ψηφιακά δεδομένα με τυχαία μετατόπιση. Η στρογγυλοποίηση μετατόπισης διασφαλίζει την κατά προσέγγιση αυθεντικότητα του εύρους διατηρώντας παράλληλα την ασφάλεια των δεδομένων, η οποία είναι πιο κοντά στα πραγματικά δεδομένα από τα προηγούμενα σχήματα και έχει μεγάλη σημασία στο σενάριο της ανάλυσης μεγάλων δεδομένων.
Το προτεινόμενο μοντέλο"ML-NPB-5660" για την Απόκρυψη Δεδομένων
4. Τεχνικές απόκρυψης δεδομένων που χρησιμοποιούνται συνήθως
(1). Στατιστικές Τεχνικές
Δειγματοληψία και συγκέντρωση δεδομένων
- Δειγματοληψία δεδομένων: Η ανάλυση και η αξιολόγηση του αρχικού συνόλου δεδομένων με την επιλογή ενός αντιπροσωπευτικού υποσυνόλου του συνόλου δεδομένων είναι μια σημαντική μέθοδος για τη βελτίωση της αποτελεσματικότητας των τεχνικών αποταυτοποίησης.
- Συγκέντρωση δεδομένων: Ως μια συλλογή στατιστικών τεχνικών (όπως άθροιση, καταμέτρηση, μέσος όρος, μέγιστο και ελάχιστο) που εφαρμόζεται σε χαρακτηριστικά στα μικροδεδομένα, το αποτέλεσμα είναι αντιπροσωπευτικό όλων των εγγραφών στο αρχικό σύνολο δεδομένων.
(2). Κρυπτογράφηση
Η κρυπτογραφία είναι μια κοινή μέθοδος για την απευαισθητοποίηση ή την ενίσχυση της αποτελεσματικότητας της απευαισθητοποίησης. Διαφορετικοί τύποι αλγορίθμων κρυπτογράφησης μπορούν να επιτύχουν διαφορετικά αποτελέσματα απευαισθητοποίησης.
- Ντετερμινιστική κρυπτογράφηση: Μια μη τυχαία συμμετρική κρυπτογράφηση. Συνήθως επεξεργάζεται δεδομένα αναγνωριστικού και μπορεί να αποκρυπτογραφήσει και να επαναφέρει το κρυπτογραφημένο κείμενο στο αρχικό αναγνωριστικό όταν είναι απαραίτητο, αλλά το κλειδί πρέπει να προστατεύεται σωστά.
- Μη αναστρέψιμη κρυπτογράφηση: Η συνάρτηση κατακερματισμού χρησιμοποιείται για την επεξεργασία δεδομένων, η οποία χρησιμοποιείται συνήθως για δεδομένα αναγνωριστικού. Δεν μπορεί να αποκρυπτογραφηθεί απευθείας και η σχέση αντιστοίχισης πρέπει να αποθηκευτεί. Επιπλέον, λόγω της δυνατότητας της συνάρτησης κατακερματισμού, ενδέχεται να προκύψει σύγκρουση δεδομένων.
- Ομομορφική κρυπτογράφηση: Χρησιμοποιείται ο ομομορφικός αλγόριθμος κρυπτογραφημένου κειμένου. Το χαρακτηριστικό του είναι ότι το αποτέλεσμα της λειτουργίας κρυπτογραφημένου κειμένου είναι το ίδιο με αυτό της λειτουργίας απλού κειμένου μετά την αποκρυπτογράφηση. Ως εκ τούτου, χρησιμοποιείται συνήθως για την επεξεργασία αριθμητικών πεδίων, αλλά δεν χρησιμοποιείται ευρέως για λόγους απόδοσης.
(3). Τεχνολογία Συστήματος
Η τεχνολογία καταστολής διαγράφει ή προστατεύει στοιχεία δεδομένων που δεν πληρούν την προστασία απορρήτου, αλλά δεν τα δημοσιεύει.
- Απόκρυψη: αναφέρεται στην πιο κοινή μέθοδο απευαισθητοποίησης για την απόκρυψη της τιμής του χαρακτηριστικού, όπως ο αριθμός αντιπάλου, η ταυτότητα επισημαίνεται με αστερίσκο ή η διεύθυνση είναι περικομμένη.
- Τοπική καταστολή: αναφέρεται στη διαδικασία διαγραφής συγκεκριμένων τιμών χαρακτηριστικών (στήλες), αφαίρεσης μη βασικών πεδίων δεδομένων.
- Καταστολή εγγραφών: αναφέρεται στη διαδικασία διαγραφής συγκεκριμένων εγγραφών (γραμμών), διαγραφής μη βασικών εγγραφών δεδομένων.
(4). Ψευδώνυμο Τεχνολογία
Το Pseudomanning είναι μια τεχνική αποταυτοποίησης που χρησιμοποιεί ένα ψευδώνυμο για να αντικαταστήσει ένα άμεσο αναγνωριστικό (ή άλλο ευαίσθητο αναγνωριστικό). Οι τεχνικές ψευδωνύμων δημιουργούν μοναδικά αναγνωριστικά για κάθε μεμονωμένο υποκείμενο πληροφοριών, αντί για άμεσα ή ευαίσθητα αναγνωριστικά.
- Μπορεί να δημιουργήσει τυχαίες τιμές ανεξάρτητα για να αντιστοιχούν στο αρχικό αναγνωριστικό, να αποθηκεύσει τον πίνακα αντιστοίχισης και να ελέγξει αυστηρά την πρόσβαση στον πίνακα αντιστοίχισης.
- Μπορείτε επίσης να χρησιμοποιήσετε κρυπτογράφηση για να δημιουργήσετε ψευδώνυμα, αλλά πρέπει να διατηρήσετε σωστά το κλειδί αποκρυπτογράφησης.
Αυτή η τεχνολογία χρησιμοποιείται ευρέως στην περίπτωση μεγάλου αριθμού ανεξάρτητων χρηστών δεδομένων, όπως το OpenID στο σενάριο ανοιχτής πλατφόρμας, όπου διαφορετικοί προγραμματιστές λαμβάνουν διαφορετικά Openids για τον ίδιο χρήστη.
(5). Τεχνικές γενίκευσης
Η τεχνική γενίκευσης αναφέρεται σε μια τεχνική απο-αναγνώρισης που μειώνει την ευαισθησία των επιλεγμένων χαρακτηριστικών σε ένα σύνολο δεδομένων και παρέχει μια πιο γενική και αφηρημένη περιγραφή των δεδομένων. Η τεχνολογία γενίκευσης είναι εύκολη στην εφαρμογή και μπορεί να προστατεύσει την αυθεντικότητα των δεδομένων σε επίπεδο εγγραφής. Χρησιμοποιείται συνήθως σε προϊόντα δεδομένων ή αναφορές δεδομένων.
- Στρογγυλοποίηση: περιλαμβάνει την επιλογή μιας βάσης στρογγυλοποίησης για το επιλεγμένο χαρακτηριστικό, όπως η ιατροδικαστική εξέταση προς τα πάνω ή προς τα κάτω, που δίνει αποτελέσματα 100, 500, 1K και 10K
- Τεχνικές κωδικοποίησης πάνω και κάτω: Αντικαταστήστε τις τιμές πάνω (ή κάτω) από το όριο με ένα όριο που αντιπροσωπεύει το ανώτερο (ή κάτω) επίπεδο, δίνοντας ένα αποτέλεσμα "πάνω από το Χ" ή "κάτω από το Χ"
(6). Τεχνικές Τυχαιοποίησης
Ως ένα είδος τεχνικής αποταυτοποίησης, η τεχνολογία τυχαιοποίησης αναφέρεται στην τροποποίηση της τιμής ενός χαρακτηριστικού μέσω τυχαιοποίησης, έτσι ώστε η τιμή μετά την τυχαιοποίηση να είναι διαφορετική από την αρχική πραγματική τιμή. Αυτή η διαδικασία μειώνει την ικανότητα ενός εισβολέα να αντλήσει μια τιμή χαρακτηριστικού από άλλες τιμές χαρακτηριστικών στην ίδια εγγραφή δεδομένων, αλλά επηρεάζει την αυθεντικότητα των δεδομένων που προκύπτουν, κάτι που είναι κοινό με τα δεδομένα δοκιμής παραγωγής.
Ώρα δημοσίευσης: Σεπ-27-2022