Índice:
Definição - O que significa Validação Cruzada?
A validação cruzada é uma técnica usada para avaliar como os resultados da análise estatística se generalizam para um conjunto de dados independente. A validação cruzada é amplamente usada em configurações nas quais o destino é previsão e é necessário estimar a precisão do desempenho de um modelo preditivo. A principal razão para o uso da validação cruzada em vez da validação convencional é que não há dados suficientes disponíveis para particioná-los em conjuntos de treinamento e teste separados (como na validação convencional). Isso resulta em uma perda de capacidade de teste e modelagem.
A validação cruzada também é conhecida como estimativa de rotação.
Techopedia explica validação cruzada
Para um problema de previsão, geralmente é fornecido um modelo com um conjunto de dados conhecidos, chamado conjunto de dados de treinamento e um conjunto de dados desconhecidos contra os quais o modelo é testado, conhecido como conjunto de dados de teste. O objetivo é ter um conjunto de dados para testar o modelo na fase de treinamento e fornecer informações sobre como o modelo específico se adapta a um conjunto de dados independente. Uma rodada de validação cruzada compreende o particionamento de dados em subconjuntos complementares, e depois a análise em um subconjunto. Depois disso, a análise é validada em outros subconjuntos (conjuntos de testes). Para reduzir a variabilidade, muitas rodadas de validação cruzada são realizadas usando muitas partições diferentes e, em seguida, uma média dos resultados é obtida. A validação cruzada é uma técnica poderosa na estimativa da técnica de desempenho do modelo.
