Índice:
Definição - O que significa Data Lake?
Um data lake é um repositório centralizado, enorme e de fácil acesso, com grandes volumes de dados estruturados e não estruturados.Techopedia explica Data Lake
A arquitetura do data lake é uma abordagem de armazenar tudo para big data. Os dados não são classificados quando armazenados no repositório, pois o valor dos dados não é claro desde o início. Como resultado, a preparação dos dados é eliminada. Um data lake é, portanto, menos estruturado em comparação com um data warehouse convencional. Quando os dados são acessados, somente então eles são classificados, organizados ou analisados.
O Hadoop, uma estrutura de código aberto para processamento e análise de big data, pode ser usada para filtrar os dados no repositório.