Q:
Quais são as quatro bases de se tornar um bom cientista de dados?
UMA:Como muitos especialistas apontam, tornar-se um grande cientista de dados requer uma combinação de habilidades e experiências que são construídas por meio de aprendizado e análise dedicados de um campo complexo. Os cientistas de dados como administradores e curadores de ativos valiosos de dados são muito procurados atualmente. Vejamos o que algumas dessas habilidades fundamentais envolvem.
O primeiro dos quatro componentes fundamentais do trabalho dos cientistas de dados é a matemática e a estatística. Os bons cientistas de dados devem aprender a conhecer vários conceitos matemáticos relacionados ao aprendizado de máquina supervisionado e não supervisionado, incluindo tipos de algoritmos como árvores de decisão, floresta aleatória, regressão logística, clustering e uso da dimensionalidade no aprendizado de máquina (ML). Em geral, eles devem ter uma boa noção de como trabalhar com equações e estatísticas matemáticas usando recursos de análise estatística.
O segundo principal componente fundamental do trabalho em ciência de dados envolve programação e gerenciamento de banco de dados. Os indivíduos devem ser fortes em linguagens de script como Python e linguagens estatísticas como R, além de experiência e habilidade com banco de dados e semântica SQL e técnicas operacionais. O conhecimento de componentes de software como Hadoop, MapReduce, Hive e Pig também são atraentes para os empregadores.
O terceiro componente fundamental de se tornar um bom cientista de dados é o componente teórico e filosófico de entender ciência de dados e aprendizado de máquina. Esses indivíduos devem ser solucionadores de problemas auto-iniciantes com mentes curiosas - afinal, eles estão combinando análise quantitativa bruta com entendimento criativo dos processos de aprendizado de máquina e ciência de dados. Em vez de ser apenas um número técnico de pessoas, eles devem ter uma base profunda no que significa criar projetos de aprendizado de máquina e trabalhar em iniciativas de ciência de dados em termos dos objetivos e resultados finais.
Um quarto pilar importante de aprender a ser um bom cientista de dados envolve trabalhar com pessoas e poder usar dados de maneiras que façam sentido para outras pessoas.
Bons cientistas de dados podem ser contadores de histórias - eles podem traduzir dados quantitativos em narrativas e idéias. Como tal, eles devem ter boas habilidades de comunicação para poder trazer seu trabalho para a mesa e disseminá-lo a vários interessados ou a um determinado público de forma eficaz. Esses são alguns dos principais tipos de habilidades que constroem um bom cientista de dados que está pronto para participar do setor de TI de ritmo acelerado e avanço rápido de hoje.
