Lar Segurança O que é perturbação de dados? - o que é techopedia

O que é perturbação de dados? - o que é techopedia

Índice:

Anonim

Definição - O que significa Perturbação de Dados?

A perturbação de dados é uma forma de mineração de dados que preserva a privacidade dos registros eletrônicos de saúde (EHR). Existem dois tipos principais de perturbação de dados apropriados para a proteção de dados EHR. O primeiro tipo é conhecido como abordagem de distribuição de probabilidade e o segundo tipo é chamado de abordagem de distorção de valor. A pertubação de dados é considerada uma técnica relativamente fácil e eficaz para proteger dados eletrônicos sensíveis do uso não autorizado.

Techopedia explica Perturbação de Dados

A pertubação de dados foi aclamada como uma aplicação mais eficaz de proteção de dados na área da saúde do que a desidentificação / re-identificação, devido à maior probabilidade de ataques que poderiam vincular conjuntos de dados públicos a identificadores ou sujeitos originais. Por essa mesma razão, a pertubação de dados é aclamada como um aplicativo mais sólido quando se trata de segurança de RSE.


A abordagem de distribuição de probabilidade pega os dados e os substitui da mesma amostra de distribuição ou da própria distribuição. A abordagem de distorção de valor perturba os dados por ruído multiplacativo ou aditivo ou outros processos aleatórios. É considerado mais eficaz que o primeiro tipo de perturbação. Essa abordagem cria classificadores de árvore de decisão em que cada elemento recebe um ruído aleatório da distribuição gaussiana, por exemplo. Pela mineração de dados, a distribuição de dados original é reconstruída a partir de sua versão perturbada. No entanto, os críticos apontam para o fato de que o ruído aditivo aleatório pode ser filtrado, o que pode resultar em comprometimentos na privacidade do EHR.

O que é perturbação de dados? - o que é techopedia