Índice:
- Definição - O que significa pré-processamento de dados?
- Techopedia explica o pré-processamento de dados
Definição - O que significa pré-processamento de dados?
O pré-processamento de dados é uma técnica de mineração de dados que envolve a transformação de dados brutos em um formato compreensível. Os dados do mundo real geralmente são incompletos, inconsistentes e / ou carecem de certos comportamentos ou tendências e provavelmente contêm muitos erros. O pré-processamento de dados é um método comprovado para resolver esses problemas. O pré-processamento de dados prepara os dados brutos para processamento adicional.
O pré-processamento de dados é usado em aplicativos orientados a bancos de dados, como gerenciamento de relacionamento com clientes e aplicativos baseados em regras (como redes neurais).
Techopedia explica o pré-processamento de dados
Os dados passam por uma série de etapas durante o pré-processamento:
- Limpeza de dados: os dados são limpos através de processos como preenchimento de valores ausentes, suavização de dados ruidosos ou resolução de inconsistências nos dados.
- Integração de dados: dados com diferentes representações são reunidos e conflitos dentro dos dados são resolvidos.
- Transformação de dados: os dados são normalizados, agregados e generalizados.
- Redução de Dados: Esta etapa tem como objetivo apresentar uma representação reduzida dos dados em um data warehouse.
- Discretização de dados: envolve a redução de vários valores de um atributo contínuo, dividindo o intervalo de intervalos de atributos.