Lar Áudio O guia de sobrevivência do data lake: o quê, por que e como do data lake

O guia de sobrevivência do data lake: o quê, por que e como do data lake

Anonim

Antigamente, ao pensar em dados digitais, fazia sentido separar dados entre dados transacionais, os dados capturados em aplicativos de negócios, armazenados em tabelas de banco de dados e apresentados por ferramentas de BI e todos os outros dados: e-mails, páginas da web, imagens, vídeos e assim por diante. Atualmente, tendemos a nos referir a outros "dados" como dados não estruturados.

Não obstante, era analisável e o software para extrair valor de tais dados atravessou o abismo. Foi esse imperativo analítico, mais do que qualquer outra coisa, que deu origem ao conceito original de um lago de dados, um armazenamento de dados para ambas as espécies de dados e, adicionalmente, para dados coletados de várias fontes externas ao negócio, algumas das quais foram inevitavelmente desestruturadas.

Neste artigo, examinaremos como o novo ecossistema criado pelo data lake não será mais composto inteiramente das transações (ou eventos) dos negócios. Também incluirá dados de outras fontes, que a empresa usa para realizar análises e informar seus usuários de informações importantes nas quais as decisões podem se basear. O sistema de registro será, como sempre, a cópia de ouro dos dados corporativos e a trilha de auditoria das atividades de TI dos negócios.

O guia de sobrevivência do data lake: o quê, por que e como do data lake