Q:
Por que a anotação de dados é importante em alguns projetos de aprendizado de máquina?
UMA:A anotação de dados é importante no aprendizado de máquina porque, em muitos casos, facilita muito o trabalho do programa de aprendizado de máquina.
Isso tem a ver com a diferença entre aprendizado de máquina supervisionado e não supervisionado. Com o aprendizado de máquina supervisionado, os dados de treinamento já estão rotulados para que a máquina possa entender mais sobre os resultados desejados. Por exemplo, se o objetivo do programa é identificar gatos em imagens, o sistema já possui um grande número de fotos marcadas como gato ou não. Em seguida, usa esses exemplos para contrastar novos dados e obter seus resultados.
Download grátis: Machine Learning e por que é importante |
Com o aprendizado de máquina não supervisionado, não há rótulos e, portanto, o sistema precisa usar atributos e outras técnicas para identificar os gatos. Os engenheiros podem treinar o programa no reconhecimento de recursos visuais de gatos, como bigodes ou caudas, mas o processo quase nunca é tão direto quanto seria no aprendizado de máquina supervisionado, onde esses rótulos desempenham um papel muito importante.
A anotação de dados é o processo de afixar rótulos nos conjuntos de dados de treinamento. Eles podem ser aplicados de muitas maneiras diferentes - acima, falamos sobre anotação de dados binários - gatos ou não gatos -, mas outros tipos de anotação de dados também são importantes. Por exemplo, no campo da medicina, a anotação de dados pode envolver a marcação de imagens biológicas específicas com tags que identificam marcadores de patologia ou doença para outras propriedades médicas.
A anotação de dados exige trabalho - e geralmente é feita por equipes de pessoas -, mas é uma parte fundamental do que faz com que muitos projetos de aprendizado de máquina funcionem com precisão. Ele fornece essa configuração inicial para ensinar a um programa o que ele precisa aprender e como discriminar várias entradas para obter resultados precisos.