Lar Bases de dados O que é descoberta de conhecimento em bancos de dados (kdd)? - o que é techopedia

O que é descoberta de conhecimento em bancos de dados (kdd)? - o que é techopedia

Índice:

Anonim

Definição - O que significa Descoberta de Conhecimento em Bancos de Dados (KDD)?

A descoberta de conhecimento em bancos de dados (KDD) é o processo de descoberta de conhecimento útil de uma coleção de dados. Essa técnica de mineração de dados amplamente usada é um processo que inclui preparação e seleção de dados, limpeza de dados, incorporação de conhecimentos prévios sobre conjuntos de dados e interpretação de soluções precisas a partir dos resultados observados.

As principais áreas de aplicação da KDD incluem marketing, detecção de fraudes, telecomunicações e manufatura.

Techopedia explica a descoberta de conhecimento em bancos de dados (KDD)

Tradicionalmente, a mineração de dados e a descoberta de conhecimento eram realizadas manualmente. Com o passar do tempo, a quantidade de dados em muitos sistemas aumentou para um tamanho superior ao terabyte e não pôde mais ser mantida manualmente. Além disso, para a existência bem-sucedida de qualquer empresa, a descoberta de padrões subjacentes nos dados é considerada essencial. Como resultado, várias ferramentas de software foram desenvolvidas para descobrir dados ocultos e fazer suposições, que faziam parte da inteligência artificial.

O processo KDD atingiu seu pico nos últimos 10 anos. Ele agora abriga muitas abordagens diferentes para a descoberta, que incluem aprendizado indutivo, estatística bayesiana, otimização de consultas semânticas, aquisição de conhecimento para sistemas especialistas e teoria da informação. O objetivo final é extrair conhecimento de alto nível de dados de baixo nível.

O KDD inclui atividades multidisciplinares. Isso inclui armazenamento e acesso a dados, escalonando algoritmos para conjuntos de dados massivos e interpretando resultados. O processo de limpeza e acesso a dados incluído no data warehousing facilita o processo KDD. A inteligência artificial também suporta o KDD, descobrindo leis empíricas a partir de experiências e observações. Os padrões reconhecidos nos dados devem ser válidos em novos dados e possuir algum grau de certeza. Esses padrões são considerados novos conhecimentos. As etapas envolvidas em todo o processo do KDD são:

  1. Identifique o objetivo do processo KDD da perspectiva do cliente.
  2. Entenda os domínios de aplicativo envolvidos e o conhecimento necessário
  3. Selecione um conjunto de dados de destino ou subconjunto de amostras de dados no qual a descoberta é realizada.
  4. Limpe e pré-processe os dados decidindo estratégias para lidar com os campos ausentes e altere os dados conforme os requisitos.
  5. Simplifique os conjuntos de dados removendo variáveis ​​indesejadas. Em seguida, analise os recursos úteis que podem ser usados ​​para representar os dados, dependendo da meta ou tarefa.
  6. Combine as metas do KDD com os métodos de mineração de dados para sugerir padrões ocultos.
  7. Escolha algoritmos de mineração de dados para descobrir padrões ocultos. Esse processo inclui decidir quais modelos e parâmetros podem ser apropriados para o processo geral do KDD.
  8. Procure padrões de interesse em uma forma representacional específica, que inclua regras ou árvores de classificação, regressão e agrupamento.
  9. Interprete o conhecimento essencial a partir dos padrões minerados.
  10. Use o conhecimento e incorpore-o em outro sistema para outras ações.
  11. Documente e faça relatórios para as partes interessadas.
O que é descoberta de conhecimento em bancos de dados (kdd)? - o que é techopedia