Lar Nas noticias Por que a seleção de recursos é tão importante no aprendizado de máquina?

Por que a seleção de recursos é tão importante no aprendizado de máquina?

Anonim

Q:

Por que a seleção de recursos é tão importante no aprendizado de máquina?

UMA:

A seleção de recursos é extremamente importante no aprendizado de máquina, principalmente porque serve como uma técnica fundamental para direcionar o uso de variáveis ​​para o que é mais eficiente e eficaz para um determinado sistema de aprendizado de máquina.

Os especialistas falam sobre como a seleção e a extração de recursos funcionam para minimizar a maldição da dimensionalidade ou ajudar a lidar com o ajuste excessivo - essas são maneiras diferentes de abordar a idéia de modelagem excessivamente complexa.

Download grátis: Machine Learning e por que é importante

Outra maneira de dizer isso é que a seleção de recursos ajuda a fornecer aos desenvolvedores as ferramentas para usar apenas os dados mais relevantes e úteis nos conjuntos de treinamento de aprendizado de máquina, o que reduz drasticamente os custos e o volume de dados.

Um exemplo é a idéia de medir uma forma complexa em escala. À medida que o programa é escalado, ele identifica um número maior de pontos de dados e o sistema se torna muito mais complexo. Mas uma forma complexa não é o conjunto de dados típico que um sistema de aprendizado de máquina está usando. Esses sistemas podem usar conjuntos de dados que apresentam níveis de variação bastante diferentes entre diferentes variáveis. Por exemplo, ao classificar espécies, os engenheiros podem usar a seleção de características para estudar apenas as variáveis ​​que lhes fornecerão os resultados mais direcionados. Se todos os animais no gráfico tiverem o mesmo número de olhos ou pernas, esses dados poderão ser removidos ou outros pontos de dados mais relevantes poderão ser extraídos.

A seleção de recursos é o processo discriminatório pelo qual os engenheiros direcionam os sistemas de aprendizado de máquina para um objetivo. Além da idéia de remover a complexidade dos sistemas em escala, a seleção de recursos também pode ser útil na otimização de aspectos do que os especialistas chamam de "trade-off de variação de polarização" no aprendizado de máquina.

As razões pelas quais a seleção de recursos ajuda na análise de desvios e variações são mais complicadas. Um estudo da Universidade de Cornell sobre seleção de recursos, variação de viés e ensacamento serve para ilustrar como a seleção de recursos auxilia os projetos.

Segundo os autores, o artigo "examina o mecanismo pelo qual a seleção de recursos melhora a precisão do aprendizado supervisionado".

O estudo afirma ainda:

Uma análise empírica de desvio / variação à medida que a seleção de recursos progride indica que o conjunto de recursos mais preciso corresponde ao melhor ponto de troca de desvio / desvio para o algoritmo de aprendizado.

Ao discutir o uso de relevância forte ou fraca, os escritores falam sobre a seleção de recursos como "um método de redução de variação" - isso faz sentido quando você pensa em variação como essencialmente a quantidade de variação em uma determinada variável. Se não houver variação, o ponto ou matriz de dados pode ser essencialmente inútil. Se houver uma variação extremamente alta, ela pode se transformar no que os engenheiros podem considerar "ruído" ou resultados arbitrários irrelevantes e difíceis de serem gerenciados pelo sistema de aprendizado de máquina.

À luz disso, a seleção de recursos é uma parte fundamental do design no aprendizado de máquina.

Por que a seleção de recursos é tão importante no aprendizado de máquina?