Lar Áudio O que é o ecossistema hadoop? - o que é techopedia

O que é o ecossistema hadoop? - o que é techopedia

Índice:

Anonim

Definição - O que significa o Hadoop Ecosystem?

O ecossistema Hadoop refere-se aos vários componentes da biblioteca de software Apache Hadoop, bem como aos acessórios e ferramentas fornecidos pela Apache Software Foundation para esses tipos de projetos de software e às maneiras como eles trabalham juntos.

O Hadoop é uma estrutura baseada em Java extremamente popular para manipular e analisar grandes conjuntos de dados.

Techopedia explica o ecossistema Hadoop

O pacote principal do Hadoop e seus acessórios são principalmente projetos de código aberto licenciados pela Apache. A ideia de um ecossistema Hadoop envolve o uso de diferentes partes do conjunto principal do Hadoop, como o MapReduce, uma estrutura para lidar com grandes quantidades de dados, e o Hadoop Distributed File System (HDFS), um sofisticado sistema de manipulação de arquivos. Há também o YARN, um gerenciador de recursos do Hadoop.

Além desses elementos principais do Hadoop, o Apache também entregou outros tipos de acessórios ou ferramentas complementares para desenvolvedores. Isso inclui o Apache Hive, uma ferramenta de análise de dados; Apache Spark, um mecanismo geral para processar big data; Apache Pig, uma linguagem de fluxo de dados; HBase, uma ferramenta de banco de dados; e também o Ambarl, que pode ser considerado um gerenciador de ecossistema do Hadoop, pois ajuda a administrar o uso desses vários recursos do Apache juntos. Com o Hadoop se tornando o padrão de fato para a coleta de dados e onipresente em muitas organizações, gerentes e líderes de desenvolvimento estão aprendendo tudo sobre o ecossistema do Hadoop e que tipos de coisas estão envolvidas em uma configuração geral do Hadoop.

O que é o ecossistema hadoop? - o que é techopedia