Índice:
Definição - O que significa o Hadoop YARN?
O Hadoop YARN é um componente específico da plataforma Hadoop de código aberto para análise de big data, licenciado pela fundação de software Apache, sem fins lucrativos.
Os principais componentes do Hadoop incluem um sistema de biblioteca central, um sistema de tratamento de arquivos Hadoop HDFS e o Hadoop MapReduce, que é um recurso de tratamento de dados em lote. Além desses, há o Hadoop YARN, que é descrito como uma plataforma de clustering que ajuda a gerenciar recursos e agendar tarefas. A fundação de software Apache, detentora da licença do Hadoop, descreve o Hadoop YARN como 'MapReduce de próxima geração' ou 'MapReduce 2.0.'
Techopedia explica o Hadoop YARN
Especialistas explicam que o conceito principal do YARN envolve a configuração de componentes de gerenciamento de recursos globais e específicos de aplicativos. Isso ajuda a alocar recursos para aplicativos específicos e gerenciar outros tipos de tarefas de monitoramento de recursos. No YARN, um cliente de envio de aplicativo envia um aplicativo ao gerenciador de recursos do YARN. YARN 'agenda' aplicativos para priorizar tarefas e manter sistemas de análise de big data. Essa é apenas uma parte de uma arquitetura maior para agregar e classificar dados, realizar consultas específicas para recuperar dados e usar o Hadoop e ferramentas relacionadas para manipular big data para business intelligence e muito mais. As empresas usam esse tipo de plataforma para examinar cadeias de suprimentos, documentar operações de produtos e serviços, acompanhar as informações dos clientes e muitos outros tipos de processos de negócios automatizados e controlados por dados.