Lar Tendências O que é melhor: uma plataforma ou um algoritmo de aprendizado de máquina que você pode usar no aws?

O que é melhor: uma plataforma ou um algoritmo de aprendizado de máquina que você pode usar no aws?

Anonim

Q:

O que é melhor, uma plataforma ou um algoritmo de aprendizado de máquina que você pode usar na AWS?

UMA:

Atualmente, muitas empresas integram soluções de aprendizado de máquina em seu conjunto de ferramentas de análise para aprimorar o gerenciamento da marca, melhorar a experiência do cliente e aumentar a eficiência operacional. Os modelos de aprendizado de máquina são o componente principal das soluções de aprendizado de máquina. Os modelos são treinados usando algoritmos matemáticos e grandes conjuntos de dados para fazer previsões confiáveis. Dois exemplos comuns de previsões são (1) determinar se um conjunto de transações financeiras indica fraude ou (2) avaliar o sentimento do consumidor em relação a um produto, com base nas informações coletadas nas mídias sociais.

O Amazon SageMaker é um serviço totalmente gerenciado que permite que desenvolvedores e cientistas de dados construam, treinem e implantem modelos de aprendizado de máquina. No SageMaker, você pode usar algoritmos prontos para uso ou seguir o caminho do trazer o seu próprio para obter uma solução mais personalizada. Ambas as opções são válidas e servem igualmente como base para uma solução bem-sucedida de aprendizado de máquina.

(Nota do editor: Você pode ver outras alternativas ao SageMaker aqui.)

Os algoritmos prontos para uso do SageMaker incluem exemplos populares e altamente otimizados para classificação de imagens, processamento de linguagem natural etc. A lista completa pode ser encontrada aqui .

  • Vantagens prontas para uso: esses algoritmos foram pré-otimizados (e estão passando por melhorias contínuas). Você pode estar instalado, executando e implantado rapidamente. Além disso, está disponível o ajuste automático de hiperparâmetros da AWS.
  • Considerações prontas para uso : As melhorias contínuas mencionadas acima podem não produzir resultados tão previsivelmente como se você tivesse controle total sobre a implementação de seus algoritmos.

Se esses algoritmos não forem adequados para o seu projeto, você terá três outras opções: (1) Apache Spark Library da Amazon, (2) código Python personalizado (que usa TensorFLow ou Apache MXNet) ou (3) "traga seu próprio" onde você são essencialmente sem restrições, mas será necessário criar uma imagem do Docker para treinar e servir seu modelo (você pode fazê-lo usando as instruções aqui ).

A abordagem "traga seu próprio" oferece total liberdade. Isso pode ser atraente para os cientistas de dados que já criaram uma biblioteca de códigos algorítmicos personalizados e / ou proprietários que podem não estar representados no atual conjunto pronto para uso.

  • Traga você mesmo as vantagens: Permite o controle completo de todo o pipeline de ciência de dados, juntamente com o uso de IP proprietário.
  • Considerações sobre o que você precisa trazer : É necessária uma dockerização para treinar e servir o modelo resultante. Incorporar melhorias algorítmicas é de sua responsabilidade.

Independentemente da sua escolha de algoritmo, o SageMaker na AWS é uma abordagem que vale a pena considerar, dado o foco da facilidade de uso na perspectiva da ciência de dados. Se você já tentou migrar um projeto de aprendizado de máquina do seu ambiente local para um hospedado, ficará agradavelmente surpreso com a perfeição do SageMaker. E se você está começando do zero, já está várias etapas mais perto do seu objetivo, considerando o quanto já está ao seu alcance.

O que é melhor: uma plataforma ou um algoritmo de aprendizado de máquina que você pode usar no aws?