Índice:
Definição - O que significa Apache Sqoop?
O Apache Sqoop ("SQL to Hadoop") é um aplicativo em modo console, baseado em Java, projetado para transferir dados em massa entre os repositórios de dados Apache Hadoop e não Hadoop, como bancos de dados relacionais, bancos de dados NoSQL e data warehouses. A versão 1.4.4 foi lançada em 31 de julho de 2013.Techopedia explica Apache Sqoop
As empresas que usam o Hadoop estão achando necessário transferir alguns de seus dados dos sistemas tradicionais de gerenciamento de banco de dados relacional (RDBMSs) para o ecossistema do Hadoop.
O Sqoop, parte integrante do Hadoop, pode executar essa transferência de maneira automatizada. Além disso, os dados importados para o Hadoop podem ser transformados com o MapReduce antes de exportá-los de volta para o RDBMS. O Sqoop também pode gerar classes Java para interagir programaticamente com dados importados.
O Sqoop usa uma arquitetura baseada em conector que permite usar plug-ins para conectar-se a bancos de dados externos.