Lar Áudio O que é análise de big data de código aberto? - o que é techopedia

O que é análise de big data de código aberto? - o que é techopedia

Índice:

Anonim

Definição - O que significa Big Data Analytics de código aberto?

A análise de big data de código aberto refere-se ao uso de software e ferramentas de código aberto para analisar grandes quantidades de dados, a fim de reunir informações relevantes e acionáveis ​​que uma organização pode usar para promover seus objetivos de negócios. O maior player em análise de big data de código aberto é o Hadoop da Apache - é a biblioteca de software mais usada para processar enormes conjuntos de dados em um cluster de computadores usando um processo distribuído para paralelismo.

Techopedia explica Big Data Open Source Analytics

A análise de big data de código aberto utiliza software e ferramentas de código aberto para executar a análise de big data usando uma plataforma de software inteira ou várias ferramentas de código aberto para diferentes tarefas no processo de análise de dados. O Apache Hadoop é o sistema mais conhecido para análise de big data, mas outros componentes são necessários para que um sistema de análise real possa ser montado.

O Hadoop é a implementação de código aberto do algoritmo MapReduce, pioneiro no Google e no Yahoo, por isso é a base da maioria dos sistemas de análise atualmente. Muitas ferramentas de análise de big data usam código-fonte aberto, incluindo sistemas robustos de banco de dados, como o MongoDB de código-fonte aberto, um banco de dados NoSQL sofisticado e escalável, adequado para aplicativos de big data, entre outros.

Os serviços de análise de big data de código aberto abrangem:

  • Sistema de coleta de dados
  • Centro de controle para administrar e monitorar clusters
  • Biblioteca de aprendizado de máquina e mineração de dados
  • Serviço de coordenação de aplicativos
  • Mecanismo de computação
  • Estrutura de execução
O que é análise de big data de código aberto? - o que é techopedia