Índice:
- Definição - O que significa o DataStage Parallel Extender (DataStage PX)?
- A Techopedia explica o DataStage Parallel Extender (DataStage PX)
Definição - O que significa o DataStage Parallel Extender (DataStage PX)?
O DataStage Parallel Extender (DataStage PX) é uma ferramenta de integração de dados IBM. É uma das muitas ferramentas de extração, transformação e carregamento (ETL) amplamente usadas na indústria de data warehousing. Essa ferramenta pode coletar informações de fontes heterogêneas, realizar transformações conforme as necessidades de uma empresa e carregar os dados nos respectivos data warehouses.
O DataStage PX também pode ser chamado de DataStage Enterprise Edition.
A Techopedia explica o DataStage Parallel Extender (DataStage PX)
O DataStage Parallel Extender possui uma arquitetura paralela para processar dados. Os dois principais tipos de paralelismo implementados no DataStage PX são o paralelismo de pipeline e partição. A capacidade de processar dados de maneira paralela acelera o processamento de dados em grande medida.
O DataStage Parallel Extender incorpora uma variedade de estágios pelos quais os dados de origem são processados e reforçados nos bancos de dados de destino. Eles são definidos em termos de terabytes. Além das etapas, o DataStage PX usa contêineres para reutilizar os componentes e as seqüências da tarefa para executar e agendar várias tarefas ao mesmo tempo.
Os estágios comumente usados no DataStage Parallel Extender incluem:
- Transformador
- Agregador
- Conjunto de dados
- cópia de
- Alterar aplicar
- Modificar
- Filtro
- Junte-se
- Mesclar
- Olho para cima