Índice:
Definição - O que significa Big Data?
Big data refere-se a um processo usado quando as técnicas tradicionais de mineração e manipulação de dados não conseguem descobrir os insights e o significado dos dados subjacentes. Dados não estruturados, sensíveis ao tempo ou simplesmente muito grandes não podem ser processados pelos mecanismos de banco de dados relacional. Esse tipo de dado requer uma abordagem de processamento diferente, chamada big data, que utiliza paralelismo massivo em hardware prontamente disponível.
Techopedia explica Big Data
Simplesmente, o big data reflete o mundo em mudança em que vivemos. Quanto mais as coisas mudam, mais as mudanças são capturadas e registradas como dados. Tome o tempo como um exemplo. Para um meteorologista, a quantidade de dados coletados em todo o mundo sobre as condições locais é substancial. Logicamente, faria sentido que os ambientes locais determinassem efeitos regionais e os efeitos regionais determinassem efeitos globais, mas poderia muito bem ser o contrário. De uma forma ou de outra, esses dados climáticos refletem os atributos do big data, onde o processamento em tempo real é necessário para uma grande quantidade de dados e onde o grande número de entradas pode ser gerado por máquina, observações pessoais ou forças externas, como manchas de sol.
O processamento de informações como essa ilustra por que o big data se tornou tão importante:
- A maioria dos dados coletados agora não é estruturada e requer armazenamento e processamento diferentes dos encontrados nos bancos de dados relacionais tradicionais.
- O poder computacional disponível está subindo rapidamente, o que significa que há mais oportunidades para processar big data.
- A Internet democratizou os dados, aumentando constantemente os dados disponíveis e, ao mesmo tempo, produzindo cada vez mais dados brutos.
Os dados em sua forma bruta não têm valor. Os dados precisam ser processados para serem valiosos. No entanto, aqui reside o problema inerente ao big data. O processamento de dados do formato de objeto nativo para um insight utilizável vale o custo de capital maciço de fazê-lo? Ou há dados demais com valores desconhecidos para justificar a aposta de processá-los com ferramentas de big data? Muitos de nós concordam que ser capaz de prever o tempo teria valor, a questão é se esse valor poderia superar os custos de triturar todos os dados em tempo real em um boletim meteorológico com o qual se pudesse contar.