Lar Bases de dados O que é um extensor paralelo de datastage (px de datastage)? - o que é techopedia

O que é um extensor paralelo de datastage (px de datastage)? - o que é techopedia

Índice:

Anonim

Definição - O que significa o DataStage Parallel Extender (DataStage PX)?

O DataStage Parallel Extender (DataStage PX) é uma ferramenta de integração de dados IBM. É uma das muitas ferramentas de extração, transformação e carregamento (ETL) amplamente usadas na indústria de data warehousing. Essa ferramenta pode coletar informações de fontes heterogêneas, realizar transformações conforme as necessidades de uma empresa e carregar os dados nos respectivos data warehouses.


O DataStage PX também pode ser chamado de DataStage Enterprise Edition.

A Techopedia explica o DataStage Parallel Extender (DataStage PX)

O DataStage Parallel Extender possui uma arquitetura paralela para processar dados. Os dois principais tipos de paralelismo implementados no DataStage PX são o paralelismo de pipeline e partição. A capacidade de processar dados de maneira paralela acelera o processamento de dados em grande medida.


O DataStage Parallel Extender incorpora uma variedade de estágios pelos quais os dados de origem são processados ​​e reforçados nos bancos de dados de destino. Eles são definidos em termos de terabytes. Além das etapas, o DataStage PX usa contêineres para reutilizar os componentes e as seqüências da tarefa para executar e agendar várias tarefas ao mesmo tempo.


Os estágios comumente usados ​​no DataStage Parallel Extender incluem:

  • Transformador
  • Agregador
  • Conjunto de dados
  • cópia de
  • Alterar aplicar
  • Modificar
  • Filtro
  • Junte-se
  • Mesclar
  • Olho para cima
O que é um extensor paralelo de datastage (px de datastage)? - o que é techopedia