Lar Áudio Como as empresas podem usar modelos florestais aleatórios para previsões?

Como as empresas podem usar modelos florestais aleatórios para previsões?

Anonim

Q:

Como as empresas podem usar modelos florestais aleatórios para previsões?

UMA:

As empresas costumam usar modelos florestais aleatórios para fazer previsões com processos de aprendizado de máquina. A floresta aleatória usa várias árvores de decisão para fazer uma análise mais holística de um determinado conjunto de dados.

Uma única árvore de decisão funciona com base na separação de uma determinada variável ou variáveis ​​de acordo com um processo binário. Por exemplo, na avaliação de conjuntos de dados relacionados a um conjunto de carros ou veículos, uma única árvore de decisão pode classificar e classificar cada veículo individualmente por peso, separando-os em veículos pesados ​​ou leves.

A floresta aleatória se baseia no modelo da árvore de decisão e a torna mais sofisticada. Os especialistas falam sobre florestas aleatórias como representando "discriminação estocástica" ou o método de "adivinhação estocástica" em dados aplicados a espaços multidimensionais. A discriminação estocástica tende a ser uma maneira de aprimorar a análise de modelos de dados além do que uma única árvore de decisão pode fazer.

Basicamente, uma floresta aleatória cria muitas árvores de decisão individuais trabalhando em variáveis ​​importantes com um determinado conjunto de dados aplicado. Um fator chave é que, em uma floresta aleatória, o conjunto de dados e a análise variável de cada árvore de decisão geralmente se sobrepõem. Isso é importante para o modelo, porque o modelo de floresta aleatória obtém os resultados médios de cada árvore de decisão e os leva a uma decisão ponderada. Em essência, a análise está obtendo todos os votos de várias árvores de decisão e construindo um consenso para oferecer resultados produtivos e lógicos.

Um exemplo de uso produtivo de um algoritmo aleatório da floresta está disponível no site do R-blogger, onde o escritor Teja Kodali leva o exemplo de determinação da qualidade do vinho por fatores como acidez, açúcar, níveis de dióxido de enxofre, valor de pH e teor de álcool. Kodali explica como um algoritmo aleatório de floresta usa um pequeno subconjunto aleatório de recursos para cada árvore individual e, em seguida, utiliza as médias resultantes.

Com isso em mente, as empresas que desejam usar algoritmos aleatórios de aprendizado de máquina da floresta para modelagem preditiva isolarão primeiro os dados preditivos que precisam ser resumidos em um conjunto de produções e depois os aplicarão ao modelo de floresta aleatória utilizando um determinado conjunto de treinamento dados. Os algoritmos de aprendizado de máquina usam esses dados de treinamento e trabalham com eles para evoluir além das restrições de sua programação original. No caso de modelos florestais aleatórios, a tecnologia aprende a formar resultados preditivos mais sofisticados usando essas árvores de decisão individuais para construir seu consenso florestal aleatório.

Uma maneira de aplicar isso aos negócios é usar várias variáveis ​​de propriedade do produto e usar uma floresta aleatória para indicar o interesse potencial do cliente. Por exemplo, se houver fatores conhecidos de interesse do cliente, como cor, tamanho, durabilidade, portabilidade ou qualquer outra coisa em que os clientes tenham indicado interesse, esses atributos poderão ser inseridos nos conjuntos de dados e analisados ​​com base em seu próprio impacto exclusivo para os fatores multifatoriais. análise.

Como as empresas podem usar modelos florestais aleatórios para previsões?