Lar Bases de dados O que é análise de dados paralela? - o que é techopedia

O que é análise de dados paralela? - o que é techopedia

Índice:

Anonim

Definição - O que significa Análise Paralela de Dados?

A análise de dados paralelos é um método para analisar dados usando processos paralelos que são executados simultaneamente em vários computadores.

O processo é usado na análise de grandes conjuntos de dados, como grandes registros de chamadas telefônicas, logs de rede e repositórios da Web para documentos de texto que podem ser grandes demais para serem colocados em um único banco de dados relacional. O método é frequentemente usado no Big Data Analytics e na análise geral de dados.

Techopedia explica Parallel Data Analysis

O conceito principal por trás da análise de dados paralelos é o paralelismo, definido na computação como a execução simultânea de processos.

Isso geralmente é conseguido com o uso de múltiplos processadores ou até vários computadores e é uma prática comum na computação distribuída. Na análise paralela de dados, computadores diferentes que executam diferentes aspectos da análise de dados executam simultaneamente esses processos e depois consolidam os resultados em um único relatório grande.

A razão desse paralelismo é principalmente tornar a análise mais rápida, mas também porque alguns conjuntos de dados podem ser muito dinâmicos, muito grandes ou simplesmente muito difíceis de serem colocados de maneira eficiente em um único banco de dados relacional. O resultado seria que esses conjuntos de dados estão alojados em diferentes bancos de dados otimizados para esse tipo de dados e em máquinas diferentes; portanto, a análise linear simplesmente não será uma opção eficiente.

O que é análise de dados paralela? - o que é techopedia