A diferença entre cientistas de dados e engenheiros de ML

Share on facebook
Share on twitter
Share on linkedin
Antônio Gusmão
Antônio Gusmão
Formado em Bacharel Sistemas de informação pela Anhanguera Educacional, Pós Graduação em Gestão da Tecnologia da Informação(Unopar), sou Desenvolvedor Senior Full Stsck. Também participo do blog Segurança Digital360 https://segurancadigital360.com.br. Praticante de Muay Thay, Crossfit & Nataçao.

Freqüentemente, há confusão entre as funções de Cientistas de Dados e Engenheiros de Machine Learning. Embora eles certamente trabalhem juntos amigavelmente e desfrutem de alguma sobreposição no que diz respeito a expertise e experiência, as duas funções têm finalidades bastante diferentes.

Essencialmente, estamos diferenciando entre cientistas que buscam entender a ciência por trás de seu trabalho e engenheiros que buscam construir algo que possa ser acessado por outras pessoas. Ambas as funções são extremamente importantes e, em algumas empresas, são intercambiáveis ​​- por exemplo, os cientistas de dados em certas organizações podem realizar o trabalho de um engenheiro de aprendizado de máquina e vice-versa.

Para tornar a distinção clara, dividirei as diferenças em 3 categorias; 

1) Responsabilidades

2) Experiência

3) Expectativas de salário.

Responsabilidades

Os cientistas de dados seguem o processo de ciência de dados, que também pode ser conhecido como fluxo de trabalho de Blitzstein e Pfister. Blitzstein e Pfister criaram inicialmente a estrutura para ensinar aos alunos do   curso Harvard CS 109 como abordar problemas de Ciência de Dados.

O processo de ciência de dados consiste em 5 fases principais

  • Etapa 1:  Compreendendo o problema de negócios
  • Etapa 2:  coleta de dados
  • Etapa 3:  limpeza e exploração de dados
  • Etapa 4:  construção de modelo
  • Etapa 5:  comunicar e visualizar insights

A maior parte do trabalho realizado por Cientistas de Dados é no ambiente de pesquisa. Nesse ambiente, os cientistas de dados realizam tarefas para entender melhor os dados para que possam construir modelos que capturem melhor os padrões inerentes aos dados. Depois de construir um modelo, a próxima etapa é avaliar se ele atende ao resultado desejado do projeto. Caso contrário, eles repetirão iterativamente o processo até que o modelo atinja o resultado desejado antes de entregá-lo aos engenheiros de aprendizado de máquina.

Os engenheiros de aprendizado de máquina são responsáveis ​​por criar e manter a infraestrutura de aprendizado de máquina que lhes permite implantar os modelos desenvolvidos por cientistas de dados em um ambiente de produção. Portanto, os engenheiros de aprendizado de máquina normalmente trabalham no ambiente de desenvolvimento, que é onde eles se preocupam em reproduzir o pipeline de aprendizado de máquina criado por cientistas de dados no ambiente de pesquisa. E trabalham no ambiente de produção, onde o modelo é disponibilizado para outros sistemas de software e / ou clientes.

Essencialmente, os engenheiros de aprendizado de máquina são responsáveis ​​pela manutenção da infraestrutura de ML que lhes permite implantar e dimensionar os modelos construídos pelos cientistas de dados. E os cientistas de dados são usuários da infraestrutura de aprendizado de máquina construída pelo engenheiro de aprendizado de máquina.

Perícia

 A razão pela qual as pessoas estão confusas sobre as diferenças entre as duas funções é que há muitos lugares onde suas habilidades se sobrepõem. Por exemplo, tanto os cientistas de dados quanto os engenheiros de aprendizado de máquina devem ter um bom conhecimento de;

  • Aprendizagem supervisionada e não supervisionada
  • Aprendizado de máquina e modelagem preditiva
  • Matemática e Estatística
  • Python (ou R)

As principais sobreposições entre as funções resultaram em algumas organizações, particularmente organizações menores e startups, fundindo as funções em uma. Assim, algumas organizações têm cientistas de dados fazendo o trabalho de engenheiros de aprendizado de máquina e outras têm engenheiros de aprendizado de máquina fazendo o trabalho de cientistas de dados. Apenas levando a mais confusão entre os praticantes.

No entanto, existem algumas diferenças importantes entre os conhecimentos necessários para cada função.

Os cientistas de dados costumam ser excelentes contadores de histórias de dados. Alguns argumentariam que essa característica os torna muito mais criativos do que os engenheiros de aprendizado de máquina. Outra diferença é que os cientistas de dados podem usar ferramentas como PowerBI e Tableau para compartilhar ideias com os negócios, e eles não precisam necessariamente usar o aprendizado de máquina.

Os casais que compensam as deficiências do parceiro geralmente são mais fortes. Quando você pensa assim, a experiência mencionada acima pode ser um ponto fraco para o engenheiro de Aprendizado de Máquina, que deve ter uma base sólida em ciência da computação e engenharia de software. Espera-se que os engenheiros de aprendizado de máquina conheçam estruturas de dados e algoritmos e compreendam os componentes fundamentais que entram na criação de software de entrega.

Com isso dito, não é incomum para um engenheiro de aprendizado de máquina ter um bom domínio de outra linguagem de programação, como Java, C ++ ou Julia.

Expectativas salariais

 Determinar as expectativas exatas de salário é difícil. Os salários em ambas as funções variam com base em uma variedade de fatores, como a quantidade de experiência que você tem, as qualificações que possui, o local em que está baseado e o setor em que trabalha.

As organizações também devem oferecer benefícios variados. Independentemente da função, você receberá um convite para ingressar no plano de pensão da empresa, trabalho flexível ou remoto, bônus por desempenho e seguro médico privado.

No Reino Unido (UK):

  • Um  jovem cientista de dados  pode esperar um início na faixa de  £ 25.000 – £ 30.000  (pode aumentar para £ 40.000 dependendo da experiência). [ Fonte :  Perspectivas ]. Um  graduado  ou  engenheiro de aprendizado de máquina de nível básico  pode esperar um salário inicial de  £ 35.000 – £ 40.000 . [ Fonte :  Prospects ]
  • De acordo com a  Glassdoor , o  salário médio de um cientista de dados  no Reino Unido é de  £ 46.818.  As perspectivas  afirmam que o  salário médio de um Engenheiro de Aprendizado de Máquina  no Reino Unido é de  £ 52.000
  • De acordo com a  Prospects , os  cientistas líderes e chefes de dados  podem ganhar algo acima de  £ 60.000  (ultrapassando £ 100.000 em alguns casos). Em contraste,  engenheiros de aprendizado de máquina mais experientes  podem esperar ganhar até  £ 170.000  (especialmente se trabalharem para uma empresa multinacional como o Google ou o Facebook) [ Fonte :  Prospects ]

Estados Unidos da América (EUA):

  • O  salário-base médio de um cientista de dados  nos EUA é de  US $ 120.089  [ Fonte :  De fato ]. Em contraste, o  salário-base médio de um engenheiro de aprendizado de máquina  nos EUA é de  US $ 150.660  [ Fonte :  De fato ].

No geral, é justo dizer que os engenheiros de aprendizado de máquina geralmente recebem mais do que os cientistas de dados em geral, em média.

Pensamentos finais

 Apesar das semelhanças entre as funções, os cientistas de dados e os engenheiros de aprendizado de máquina são bastante diferentes em relação às suas responsabilidades, especialização e ganhos. Da maioria das entrevistas que ouvi sobre o assunto, muitos dizem que a transição de Cientistas de Dados para Engenheiros de Aprendizado de Máquina é muito mais difícil do que a transição de Engenheiro de Aprendizado de Máquina para Cientistas de Dados. Isso ocorre porque os cientistas de dados geralmente não são proficientes em fundamentos de engenharia de software e ciência da computação, o que é uma grande curva de aprendizado.

Obrigado pela leitura!