Índice:
O volume de big data está aumentando bastante dia a dia. De 2.500 exabytes em 2012, espera-se que o big data aumente para 40.000 exabytes em 2020. Portanto, o armazenamento de dados é um sério desafio que apenas a infraestrutura de nuvem é capaz de lidar. A nuvem tornou-se uma opção popular principalmente devido à sua enorme capacidade de armazenamento e aos termos e condições de uso que não impõem nenhuma obrigação ao assinante. O armazenamento em nuvem pode ser oferecido na forma de assinaturas e serviços por um período predeterminado. Depois disso, não há obrigação por parte do cliente de renová-lo.
No entanto, o armazenamento de big data na nuvem abre novos desafios de segurança que não podem ser enfrentados com as medidas de segurança adotadas para dados estáticos e regulares. Embora o big data não seja um conceito novo, sua coleta e uso começaram a acelerar apenas nos últimos anos. No passado, o armazenamento e a análise de big data eram restritos apenas às grandes empresas e ao governo que podiam pagar a infraestrutura necessária para o armazenamento e mineração de dados. Essa infraestrutura era proprietária e não exposta a redes gerais. No entanto, agora o big data está disponível de forma barata para todos os tipos de empresas através da infraestrutura de nuvem pública. Como resultado, novas e sofisticadas ameaças à segurança surgiram e continuam se multiplicando e evoluindo.
Problemas de segurança em estruturas de programação distribuída
As estruturas de programação distribuída processam big data com técnicas paralelas de computação e armazenamento. Nessas estruturas, mapeadores não autenticados ou modificados - que dividem grandes tarefas em subtarefas menores para que as tarefas possam ser agregadas para criar uma saída final - podem comprometer os dados. Nós de trabalho com defeito ou modificados - que recebem entradas do mapeador para executar as tarefas - podem comprometer os dados tocando na comunicação de dados entre o mapeador e outros nós de trabalho. Nós de trabalhadores não autorizados também podem criar cópias de nós de trabalhadores legítimos. O fato de ser extremamente difícil identificar nós ou mapeadores não autorizados em uma estrutura tão grande torna a segurança dos dados ainda mais desafiadora.