Índice:
- Definição - O que significa Big Data Analytics de código aberto?
- Techopedia explica Big Data Open Source Analytics
Definição - O que significa Big Data Analytics de código aberto?
A análise de big data de código aberto refere-se ao uso de software e ferramentas de código aberto para analisar grandes quantidades de dados, a fim de reunir informações relevantes e acionáveis que uma organização pode usar para promover seus objetivos de negócios. O maior player em análise de big data de código aberto é o Hadoop da Apache - é a biblioteca de software mais usada para processar enormes conjuntos de dados em um cluster de computadores usando um processo distribuído para paralelismo.
Techopedia explica Big Data Open Source Analytics
A análise de big data de código aberto utiliza software e ferramentas de código aberto para executar a análise de big data usando uma plataforma de software inteira ou várias ferramentas de código aberto para diferentes tarefas no processo de análise de dados. O Apache Hadoop é o sistema mais conhecido para análise de big data, mas outros componentes são necessários para que um sistema de análise real possa ser montado.
O Hadoop é a implementação de código aberto do algoritmo MapReduce, pioneiro no Google e no Yahoo, por isso é a base da maioria dos sistemas de análise atualmente. Muitas ferramentas de análise de big data usam código-fonte aberto, incluindo sistemas robustos de banco de dados, como o MongoDB de código-fonte aberto, um banco de dados NoSQL sofisticado e escalável, adequado para aplicativos de big data, entre outros.
Os serviços de análise de big data de código aberto abrangem:
- Sistema de coleta de dados
- Centro de controle para administrar e monitorar clusters
- Biblioteca de aprendizado de máquina e mineração de dados
- Serviço de coordenação de aplicativos
- Mecanismo de computação
- Estrutura de execução