Índice:
Definição - O que significa Data Sandbox?
Uma caixa de proteção de dados, no contexto de big data, é uma plataforma escalável e de desenvolvimento usada para explorar os ricos conjuntos de informações de uma organização por meio de interação e colaboração. Ele permite que uma empresa realize seu valor real de investimento em big data.
Uma área restrita de dados é explorada principalmente por equipes de ciência de dados que obtêm plataformas de área restrita a partir de datamarts analíticos independentes ou partições lógicas em data warehouses corporativos. As plataformas de sandbox de dados fornecem a computação necessária para os cientistas de dados lidarem com cargas de trabalho analíticas tipicamente complexas.
Techopedia explica Data Sandbox
Uma caixa de proteção de dados inclui enormes unidades de processamento central paralelo, memória de ponta, armazenamento de alta capacidade e capacidade de E / S e normalmente separa os ambientes de experimentação de dados e banco de dados de produção em data warehouses.
O IBM Netezza 1000 é um exemplo de plataforma de sandbox de dados que é um data mart analítico independente. Um exemplo de uma partição lógica em um data warehouse corporativo, que também serve como plataforma de sandbox de dados, é o IBM Smart Analytics System. Um cluster Hadoop como o IBM InfoSphere BigInsights Enterprise Edition também está incluído nesta categoria.