Ποια είναι η τεχνολογία και η λύση απόκρυψης δεδομένων στο Network Packet Broker;

1. Η έννοια της Απόκρυψης Δεδομένων

Η απόκρυψη δεδομένων είναι επίσης γνωστή ως απόκρυψη δεδομένων. Είναι μια τεχνική μέθοδος για τη μετατροπή, τροποποίηση ή κάλυψη ευαίσθητων δεδομένων, όπως ο αριθμός κινητού τηλεφώνου, ο αριθμός τραπεζικής κάρτας και άλλες πληροφορίες, όταν έχουμε δώσει κανόνες και πολιτικές απόκρυψης. Αυτή η τεχνική χρησιμοποιείται κυρίως για την αποτροπή της άμεσης χρήσης ευαίσθητων δεδομένων σε αναξιόπιστα περιβάλλοντα.

Αρχή της απόκρυψης δεδομένων: Η απόκρυψη δεδομένων θα πρέπει να διατηρεί τα αρχικά χαρακτηριστικά των δεδομένων, τους επιχειρηματικούς κανόνες και τη συνάφεια των δεδομένων, ώστε να διασφαλίζεται ότι η επακόλουθη ανάπτυξη, δοκιμή και ανάλυση δεδομένων δεν θα επηρεαστούν από την απόκρυψη. Διασφαλίζεται η συνέπεια και η εγκυρότητα των δεδομένων πριν και μετά την απόκρυψη.

2. Ταξινόμηση μάσκας δεδομένων

Η απόκρυψη δεδομένων μπορεί να χωριστεί σε στατική απόκρυψη δεδομένων (SDM) και δυναμική απόκρυψη δεδομένων (DDM).

Στατική απόκρυψη δεδομένων (SDM)Η στατική απόκρυψη δεδομένων απαιτεί τη δημιουργία μιας νέας βάσης δεδομένων μη παραγωγικού περιβάλλοντος για απομόνωση από το περιβάλλον παραγωγής. Τα ευαίσθητα δεδομένα εξάγονται από τη βάση δεδομένων παραγωγής και στη συνέχεια αποθηκεύονται στη βάση δεδομένων μη παραγωγικής χρήσης. Με αυτόν τον τρόπο, τα απευαισθητοποιημένα δεδομένα απομονώνονται από το περιβάλλον παραγωγής, γεγονός που καλύπτει τις επιχειρηματικές ανάγκες και διασφαλίζει την ασφάλεια των δεδομένων παραγωγής.

SDM

Δυναμική απόκρυψη δεδομένων (DDM)Χρησιμοποιείται γενικά στο περιβάλλον παραγωγής για την απευαισθητοποίηση ευαίσθητων δεδομένων σε πραγματικό χρόνο. Μερικές φορές, απαιτούνται διαφορετικά επίπεδα απόκρυψης για την ανάγνωση των ίδιων ευαίσθητων δεδομένων σε διαφορετικές καταστάσεις. Για παράδειγμα, διαφορετικοί ρόλοι και δικαιώματα ενδέχεται να εφαρμόζουν διαφορετικά σχήματα απόκρυψης.

DDM

Εφαρμογή αναφοράς δεδομένων και απόκρυψης προϊόντων δεδομένων

Τέτοια σενάρια περιλαμβάνουν κυρίως εσωτερικά προϊόντα παρακολούθησης δεδομένων ή πινακίδες, εξωτερικά προϊόντα δεδομένων υπηρεσιών και αναφορές που βασίζονται σε ανάλυση δεδομένων, όπως επιχειρηματικές αναφορές και ανασκόπηση έργων.

απόκρυψη προϊόντος αναφοράς δεδομένων

3. Λύση απόκρυψης δεδομένων

Τα συνηθισμένα σχήματα απόκρυψης δεδομένων περιλαμβάνουν: ακύρωση, τυχαία τιμή, αντικατάσταση δεδομένων, συμμετρική κρυπτογράφηση, μέση τιμή, μετατόπιση και στρογγυλοποίηση, κ.λπ.

ΑκύρωσηΗ ακύρωση αναφέρεται στην κρυπτογράφηση, την περικοπή ή την απόκρυψη ευαίσθητων δεδομένων. Αυτό το σχήμα συνήθως αντικαθιστά τα πραγματικά δεδομένα με ειδικά σύμβολα (όπως *). Η λειτουργία είναι απλή, αλλά οι χρήστες δεν μπορούν να γνωρίζουν τη μορφή των αρχικών δεδομένων, κάτι που μπορεί να επηρεάσει τις επόμενες εφαρμογές δεδομένων.

Τυχαία τιμήΗ τυχαία τιμή αναφέρεται στην τυχαία αντικατάσταση ευαίσθητων δεδομένων (οι αριθμοί αντικαθιστούν τα ψηφία, τα γράμματα αντικαθιστούν τα γράμματα και οι χαρακτήρες αντικαθιστούν τους χαρακτήρες). Αυτή η μέθοδος απόκρυψης θα διασφαλίσει τη μορφοποίηση των ευαίσθητων δεδομένων σε κάποιο βαθμό και θα διευκολύνει την επακόλουθη εφαρμογή δεδομένων. Ενδέχεται να χρειαστούν λεξικά απόκρυψης για ορισμένες λέξεις με νόημα, όπως ονόματα ανθρώπων και τοποθεσιών.

Αντικατάσταση ΔεδομένωνΗ αντικατάσταση δεδομένων είναι παρόμοια με την απόκρυψη μηδενικών και τυχαίων τιμών, εκτός από το ότι αντί να χρησιμοποιούνται ειδικοί χαρακτήρες ή τυχαίες τιμές, τα δεδομένα απόκρυψης αντικαθίστανται με μια συγκεκριμένη τιμή.

Συμμετρική ΚρυπτογράφησηΗ συμμετρική κρυπτογράφηση είναι μια ειδική αναστρέψιμη μέθοδος κάλυψης. Κρυπτογραφεί ευαίσθητα δεδομένα μέσω κλειδιών κρυπτογράφησης και αλγορίθμων. Η μορφή κρυπτογραφημένου κειμένου είναι συμβατή με τα αρχικά δεδομένα στους λογικούς κανόνες.

ΜέσοςΤο σχήμα μέσου όρου χρησιμοποιείται συχνά σε στατιστικά σενάρια. Για τα αριθμητικά δεδομένα, πρώτα υπολογίζουμε τον μέσο όρο τους και στη συνέχεια κατανέμουμε τυχαία τις απευαισθητοποιημένες τιμές γύρω από τον μέσο όρο, διατηρώντας έτσι το άθροισμα των δεδομένων σταθερό.

Μετατόπιση και στρογγυλοποίησηΑυτή η μέθοδος αλλάζει τα ψηφιακά δεδομένα με τυχαία μετατόπιση. Η στρογγυλοποίηση μετατόπισης διασφαλίζει την κατά προσέγγιση αυθεντικότητα του εύρους διατηρώντας παράλληλα την ασφάλεια των δεδομένων, η οποία είναι πιο κοντά στα πραγματικά δεδομένα από τα προηγούμενα σχήματα και έχει μεγάλη σημασία στο σενάριο ανάλυσης μεγάλων δεδομένων.

ML-NPB-5660-数据脱敏

Το προτεινόμενο μοντέλο"ML-NPB-5660"για την απόκρυψη δεδομένων

4. Συνήθεις χρησιμοποιούμενες τεχνικές απόκρυψης δεδομένων

(1). Στατιστικές Τεχνικές

Δειγματοληψία και συγκέντρωση δεδομένων

- Δειγματοληψία δεδομένων: Η ανάλυση και η αξιολόγηση του αρχικού συνόλου δεδομένων επιλέγοντας ένα αντιπροσωπευτικό υποσύνολο του συνόλου δεδομένων αποτελεί σημαντική μέθοδο για τη βελτίωση της αποτελεσματικότητας των τεχνικών αποταυτοποίησης.

- Συγκέντρωση δεδομένων: Ως ένα σύνολο στατιστικών τεχνικών (όπως άθροιση, καταμέτρηση, μέσος όρος, μέγιστο και ελάχιστο) που εφαρμόζονται σε χαρακτηριστικά σε μικροδεδομένα, το αποτέλεσμα είναι αντιπροσωπευτικό όλων των εγγραφών στο αρχικό σύνολο δεδομένων.

(2). Κρυπτογραφία

Η κρυπτογραφία είναι μια κοινή μέθοδος για την απευαισθητοποίηση ή την ενίσχυση της αποτελεσματικότητας της απευαισθητοποίησης. Διαφορετικοί τύποι αλγορίθμων κρυπτογράφησης μπορούν να επιτύχουν διαφορετικά αποτελέσματα απευαισθητοποίησης.

- Ντετερμινιστική κρυπτογράφηση: Μια μη τυχαία συμμετρική κρυπτογράφηση. Συνήθως επεξεργάζεται δεδομένα ταυτότητας και μπορεί να αποκρυπτογραφήσει και να επαναφέρει το κρυπτογραφημένο κείμενο στο αρχικό αναγνωριστικό όταν είναι απαραίτητο, αλλά το κλειδί πρέπει να προστατεύεται σωστά.

- Μη αναστρέψιμη κρυπτογράφηση: Η συνάρτηση κατακερματισμού χρησιμοποιείται για την επεξεργασία δεδομένων, η οποία συνήθως χρησιμοποιείται για δεδομένα ταυτότητας. Δεν μπορεί να αποκρυπτογραφηθεί απευθείας και η σχέση αντιστοίχισης πρέπει να αποθηκευτεί. Επιπλέον, λόγω του χαρακτηριστικού της συνάρτησης κατακερματισμού, ενδέχεται να προκύψει σύγκρουση δεδομένων.

- Ομομορφική κρυπτογράφηση: Χρησιμοποιείται ο ομομορφικός αλγόριθμος κρυπτογραφημένου κειμένου. Χαρακτηριστικό του είναι ότι το αποτέλεσμα της λειτουργίας κρυπτογραφημένου κειμένου είναι το ίδιο με αυτό της λειτουργίας απλού κειμένου μετά την αποκρυπτογράφηση. Επομένως, χρησιμοποιείται συνήθως για την επεξεργασία αριθμητικών πεδίων, αλλά δεν χρησιμοποιείται ευρέως για λόγους απόδοσης.

(3). Τεχνολογία Συστημάτων

Η τεχνολογία καταστολής διαγράφει ή προστατεύει στοιχεία δεδομένων που δεν πληρούν την προστασία απορρήτου, αλλά δεν τα δημοσιεύει.

- Μάσκα: αναφέρεται στην πιο κοινή μέθοδο απευαισθητοποίησης για την κάλυψη της τιμής του χαρακτηριστικού, όπως ο αριθμός του αντιπάλου, η ταυτότητα που σημειώνεται με αστερίσκο ή η διεύθυνση που περικόπτεται.

- Τοπική καταστολή: αναφέρεται στη διαδικασία διαγραφής συγκεκριμένων τιμών χαρακτηριστικών (στηλών), αφαιρώντας μη απαραίτητα πεδία δεδομένων.

- Καταστολή εγγραφών: αναφέρεται στη διαδικασία διαγραφής συγκεκριμένων εγγραφών (γραμμών), διαγραφής μη απαραίτητων εγγραφών δεδομένων.

(4). Τεχνολογία Ψευδονύμων

Η ψευδωνυμοποίηση είναι μια τεχνική αποταυτοποίησης που χρησιμοποιεί ψευδώνυμο για να αντικαταστήσει ένα άμεσο αναγνωριστικό (ή άλλο ευαίσθητο αναγνωριστικό). Οι τεχνικές ψευδωνύμων δημιουργούν μοναδικά αναγνωριστικά για κάθε μεμονωμένο υποκείμενο πληροφοριών, αντί για άμεσα ή ευαίσθητα αναγνωριστικά.

- Μπορεί να δημιουργήσει τυχαίες τιμές ανεξάρτητα για να αντιστοιχούν στο αρχικό αναγνωριστικό, να αποθηκεύσει τον πίνακα αντιστοίχισης και να ελέγξει αυστηρά την πρόσβαση στον πίνακα αντιστοίχισης.

- Μπορείτε επίσης να χρησιμοποιήσετε κρυπτογράφηση για να δημιουργήσετε ψευδώνυμα, αλλά πρέπει να φυλάξετε σωστά το κλειδί αποκρυπτογράφησης.

Αυτή η τεχνολογία χρησιμοποιείται ευρέως στην περίπτωση μεγάλου αριθμού ανεξάρτητων χρηστών δεδομένων, όπως το OpenID στο σενάριο ανοιχτής πλατφόρμας, όπου διαφορετικοί προγραμματιστές λαμβάνουν διαφορετικά Openids για τον ίδιο χρήστη.

(5). Τεχνικές Γενίκευσης

Η τεχνική γενίκευσης αναφέρεται σε μια τεχνική αποταυτοποίησης που μειώνει την λεπτομέρεια των επιλεγμένων χαρακτηριστικών σε ένα σύνολο δεδομένων και παρέχει μια πιο γενική και αφηρημένη περιγραφή των δεδομένων. Η τεχνολογία γενίκευσης είναι εύκολη στην εφαρμογή και μπορεί να προστατεύσει την αυθεντικότητα των δεδομένων σε επίπεδο εγγραφής. Χρησιμοποιείται συνήθως σε προϊόντα δεδομένων ή αναφορές δεδομένων.

- Στρογγυλοποίηση: περιλαμβάνει την επιλογή μιας βάσης στρογγυλοποίησης για το επιλεγμένο χαρακτηριστικό, όπως ανοδική ή καθοδική εγκληματολογία, που αποδίδει αποτελέσματα 100, 500, 1K και 10K

- Τεχνικές κωδικοποίησης άνω και κάτω: Αντικατάσταση τιμών πάνω (ή κάτω) από το όριο με ένα όριο που αντιπροσωπεύει το άνω (ή κάτω) επίπεδο, αποδίδοντας ένα αποτέλεσμα "πάνω από το X" ή "κάτω από το X"

(6). Τεχνικές τυχαιοποίησης

Ως ένα είδος τεχνικής αποταυτοποίησης, η τεχνολογία τυχαιοποίησης αναφέρεται στην τροποποίηση της τιμής ενός χαρακτηριστικού μέσω τυχαιοποίησης, έτσι ώστε η τιμή μετά την τυχαιοποίηση να είναι διαφορετική από την αρχική πραγματική τιμή. Αυτή η διαδικασία μειώνει την ικανότητα ενός εισβολέα να εξαγάγει μια τιμή χαρακτηριστικού από άλλες τιμές χαρακτηριστικών στο ίδιο αρχείο δεδομένων, αλλά επηρεάζει την αυθεντικότητα των δεδομένων που προκύπτουν, κάτι που είναι σύνηθες με τα δεδομένα δοκιμών παραγωγής.


Ώρα δημοσίευσης: 27 Σεπτεμβρίου 2022