Índice:
Definição - O que significa Mineração de Dados?
A mineração de dados é o processo de analisar padrões ocultos de dados de acordo com diferentes perspectivas para categorizar em informações úteis, que são coletadas e montadas em áreas comuns, como data warehouses, para análises eficientes, algoritmos de mineração de dados, facilitando a tomada de decisões de negócios e outras informações requisitos para reduzir custos e aumentar a receita.
A mineração de dados também é conhecida como descoberta de dados e descoberta de conhecimento.
Techopedia explica Mineração de Dados
As principais etapas envolvidas em um processo de mineração de dados são:
- Extrair, transformar e carregar dados em um data warehouse
- Armazene e gerencie dados em bancos de dados multidimensionais
- Fornecer acesso a dados para analistas de negócios usando software aplicativo
- Apresentar dados analisados de formas facilmente compreensíveis, como gráficos
O primeiro passo na mineração de dados é reunir dados relevantes e críticos para os negócios. Os dados da empresa são transacionais, não operacionais ou metadados. Os dados transacionais lidam com as operações diárias, como vendas, estoque e custo, etc. Os dados não operacionais são normalmente previstos, enquanto os metadados se preocupam com o design lógico do banco de dados. Padrões e relacionamentos entre elementos de dados renderizam informações relevantes, o que pode aumentar a receita organizacional. As organizações com forte foco no consumidor lidam com técnicas de mineração de dados, fornecendo imagens claras dos produtos vendidos, preço, concorrência e dados demográficos dos clientes.
Por exemplo, o gigante do varejo Wal-Mart transmite todas as suas informações relevantes para um data warehouse com terabytes de dados. Esses dados podem ser facilmente acessados pelos fornecedores, permitindo que eles identifiquem os padrões de compra dos clientes. Eles podem gerar padrões nos hábitos de compra, nos dias mais comprados, mais procurados por produtos e outros dados utilizando técnicas de mineração de dados.
O segundo passo na mineração de dados é selecionar um algoritmo adequado - um mecanismo que produz um modelo de mineração de dados. O trabalho geral do algoritmo envolve a identificação de tendências em um conjunto de dados e o uso da saída para definição de parâmetros. Os algoritmos mais populares usados para mineração de dados são algoritmos de classificação e algoritmos de regressão, que são usados para identificar relacionamentos entre elementos de dados. Os principais fornecedores de bancos de dados, como Oracle e SQL, incorporam algoritmos de mineração de dados, como árvores de cluster e regressão, para atender à demanda por mineração de dados.