Índice:
Definição - O que significa Dados não marcados?
Dados não rotulados são uma designação para dados que não foram marcados com rótulos que identificam características, propriedades ou classificações. Dados não rotulados são normalmente usados em várias formas de aprendizado de máquina.
Techopedia explica dados não rotulados
Nos tipos de aprendizado de máquina chamados de aprendizado de máquina não supervisionado, o programa de aprendizado de máquina opera avaliando conjuntos de dados não rotulados. Como os dados não possuem rótulos, o programa de aprendizado de máquina precisa identificar cada pedaço de dados em suas propriedades e características.
Uma das melhores maneiras de explicar isso é usando a metáfora da fruteira. Suponha que o programa de aprendizado de máquina esteja aprendendo a identificar três tipos diferentes de frutas - bananas, uvas e maçãs. Se os dados no conjunto de treinamento inicial forem rotulados, o programa de aprendizado de máquina funcionará a partir dessa perspectiva - correspondendo imagens sucessivas a uma dessas três categorias.
Se, no entanto, nenhuma das peças de dados estiver identificada com os três nomes das frutas - banana, uva e maçã - o programa de aprendizado de máquina precisará funcionar avaliando cada imagem e analisando características como cor - amarelo, vermelho ou roxo - formas - longo e fino, redondo ou agrupado - e outras características.
A partir deste exemplo, é fácil ver como os dados rotulados oferecem oportunidades muito mais fáceis de usar algoritmos de aprendizado de máquina para resultados de decisão. No entanto, programas sofisticados de aprendizado de máquina não supervisionados que lidam com dados não rotulados também podem produzir resultados incrivelmente exatos.