Índice:
- Definição - O que significa Descoberta de Conhecimento em Bancos de Dados (KDD)?
- Techopedia explica a descoberta de conhecimento em bancos de dados (KDD)
Definição - O que significa Descoberta de Conhecimento em Bancos de Dados (KDD)?
A descoberta de conhecimento em bancos de dados (KDD) é o processo de descoberta de conhecimento útil de uma coleção de dados. Essa técnica de mineração de dados amplamente usada é um processo que inclui preparação e seleção de dados, limpeza de dados, incorporação de conhecimentos prévios sobre conjuntos de dados e interpretação de soluções precisas a partir dos resultados observados.
As principais áreas de aplicação da KDD incluem marketing, detecção de fraudes, telecomunicações e manufatura.
Techopedia explica a descoberta de conhecimento em bancos de dados (KDD)
Tradicionalmente, a mineração de dados e a descoberta de conhecimento eram realizadas manualmente. Com o passar do tempo, a quantidade de dados em muitos sistemas aumentou para um tamanho superior ao terabyte e não pôde mais ser mantida manualmente. Além disso, para a existência bem-sucedida de qualquer empresa, a descoberta de padrões subjacentes nos dados é considerada essencial. Como resultado, várias ferramentas de software foram desenvolvidas para descobrir dados ocultos e fazer suposições, que faziam parte da inteligência artificial.
O processo KDD atingiu seu pico nos últimos 10 anos. Ele agora abriga muitas abordagens diferentes para a descoberta, que incluem aprendizado indutivo, estatística bayesiana, otimização de consultas semânticas, aquisição de conhecimento para sistemas especialistas e teoria da informação. O objetivo final é extrair conhecimento de alto nível de dados de baixo nível.
O KDD inclui atividades multidisciplinares. Isso inclui armazenamento e acesso a dados, escalonando algoritmos para conjuntos de dados massivos e interpretando resultados. O processo de limpeza e acesso a dados incluído no data warehousing facilita o processo KDD. A inteligência artificial também suporta o KDD, descobrindo leis empíricas a partir de experiências e observações. Os padrões reconhecidos nos dados devem ser válidos em novos dados e possuir algum grau de certeza. Esses padrões são considerados novos conhecimentos. As etapas envolvidas em todo o processo do KDD são:
- Identifique o objetivo do processo KDD da perspectiva do cliente.
- Entenda os domínios de aplicativo envolvidos e o conhecimento necessário
- Selecione um conjunto de dados de destino ou subconjunto de amostras de dados no qual a descoberta é realizada.
- Limpe e pré-processe os dados decidindo estratégias para lidar com os campos ausentes e altere os dados conforme os requisitos.
- Simplifique os conjuntos de dados removendo variáveis indesejadas. Em seguida, analise os recursos úteis que podem ser usados para representar os dados, dependendo da meta ou tarefa.
- Combine as metas do KDD com os métodos de mineração de dados para sugerir padrões ocultos.
- Escolha algoritmos de mineração de dados para descobrir padrões ocultos. Esse processo inclui decidir quais modelos e parâmetros podem ser apropriados para o processo geral do KDD.
- Procure padrões de interesse em uma forma representacional específica, que inclua regras ou árvores de classificação, regressão e agrupamento.
- Interprete o conhecimento essencial a partir dos padrões minerados.
- Use o conhecimento e incorpore-o em outro sistema para outras ações.
- Documente e faça relatórios para as partes interessadas.