Índice:
Definição - O que significa SQL no Hadoop?
O SQL no Hadoop é um tipo de ferramenta de aplicação analítica - a implementação do SQL na plataforma Hadoop, que combina a consulta padrão de dados estruturados no estilo SQL com a estrutura de dados do Hadoop. O Hadoop é uma plataforma relativamente nova, assim como o big data, e poucos profissionais são especialistas nela, mas o SQL no Hadoop simplifica o acesso à estrutura do Hadoop e facilita a implementação nos sistemas corporativos atuais.
Techopedia explica SQL no Hadoop
SQL no Hadoop refere-se a várias implementações do SQL para a plataforma Hadoop. O MapReduce, que é o mapeador de tarefas de cluster e o organizador de resultados do Hadoop, oferece suporte ao SQL como um dos principais casos de uso e outros métodos de processamento. Portanto, faz sentido criar ferramentas poderosas para permitir o SQL, que é uma das linguagens mais usadas para consulta e manipulação de banco de dados. À medida que o Hadoop ganha popularidade na arquitetura de dados corporativos, o SQL é essencial para a adoção adequada de dados de estrutura fraca e dados estruturados usados no Hadoop.
Os principais drivers do SQL on Hadoop incluem:
- Aproveitando as habilidades SQL existentes presentes na maioria das organizações
- Reutilizando Extract Transform Load (ETL), Business Intelligence (BI) e investimentos em infraestrutura de análise no Hadoop
Algumas implementações do SQL on Hadoop incluem:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica no MapR
- Drivers ODBC
- Presto
- Tubarão