Lar Áudio Qual é a diferença entre aprendizado supervisionado, não supervisionado e semi-supervisionado?

Qual é a diferença entre aprendizado supervisionado, não supervisionado e semi-supervisionado?

Anonim

Q:

Qual é a diferença entre aprendizado supervisionado, não supervisionado e semi-supervisionado?

UMA:

A principal diferença entre aprendizado supervisionado e não supervisionado no aprendizado de máquina é o uso de dados de treinamento.

O aprendizado supervisionado utiliza dados de exemplo para mostrar como são os dados "corretos". Os dados estão estruturados para mostrar as saídas de determinadas entradas.

Um algoritmo de aprendizado de máquina que classifica frutas pode ter figuras de frutas como maçãs, bananas, uvas e laranjas como entradas e os nomes dessas frutas como saídas.

Um exemplo do mundo real seriam os filtros de spam bayesianos em programas de email. Esses filtros são treinados com exemplos de e-mails considerados spam. O filtro de spam pode procurar determinadas frases que aparecem nos emails que ocorrem nos emails de spam e movê-las para uma pasta de spam.

É como mostrar a um humano como executar uma nova tarefa. Uma pessoa que faz a entrada de dados pode receber exemplos dos dados em um formato que a empresa deseja e, em seguida, espera-se que os siga.

Os programas de aprendizado de máquina que usam aprendizado supervisionado repetem-se muitas vezes com os dados de treinamento. Os resultados podem ser impressionantes quando realmente começam. O filtro de spam do Google Gmail é muito preciso, porque há muitos usuários treinando-o.

O aprendizado não supervisionado não possui dados de treinamento anteriores. No nosso exemplo de classificação de frutas, um algoritmo pode apenas ser mostrado fotos de frutas e instruído a classificá-las.

O aprendizado não supervisionado possui aplicações em pesquisa de mercado, aprendendo hábitos de compra do cliente ou segurança, monitorando padrões de hackers.

O aprendizado semi-supervisionado tenta adotar um meio termo, rotulando alguns dos dados. Por exemplo, a maçã e a laranja podem ser rotuladas no programa de classificação de frutas, mas a banana e as uvas não.

Quando usar qualquer um desses algoritmos dependerá do tipo de dados que está sendo usado. Algumas tarefas têm padrões estáveis, como fraude no cartão de crédito ou mensagens de spam. O aprendizado supervisionado é apropriado para esses tipos de tarefas. Os ataques à rede são imprevisíveis e métodos de aprendizado sem supervisão ou semi-supervisionados podem ser mais apropriados.

Qual é a diferença entre aprendizado supervisionado, não supervisionado e semi-supervisionado?