carreira destaque

O que faz um cientista de dados?

O que faz e qual o salário de um Cientista de Dados? Descubra se essa é a carreira ideal para você

O que faz e qual o salário de um Cientista de dados

Sou Cientista de Dados na Kakau há alguns anos. Meu papel é ajudar a empresa trazendo novas ideias e descobertas (sim, tipo um cientista) a partir de experimentos com dados (não, não preciso trabalhar de jaleco).

Dados? Sim, toda empresa possui muitos dados ou informações a respeito das pessoas, transações, equipamentos, dados financeiros e por aí vai. Esses dados eram utilizados com base na experiência das gestoras e algumas vezes no famoso achismo.

Porém, com o tempo a quantidade de dados começou a se tornar imensa e se tornou muito difícil a análise por meio de observações de pessoas. Foi aí que os estatísticos começaram a utilizar computadores para analisarem esses dados e trazerem resultados.

Ciência de dados possui três pilares. Programação, estatística (algorítimos) e método científico.

Ciência de dados é um campo que envolve três pilares

Programação

O desenvolvimento de software – saber “conversar” com as máquinas – é um dos pilares da ciência de dados. Saber o básico de programação é cada vez mais importante em várias áreas. E essa é a ferramenta do cientista de dados: sentar a bunda na cadeira e conectar-se através do seu código nas imensas bases de dados das empresas.

Estatística

O conhecimento sobre estatística e algoritmos matemáticos, que nada mais são do que fórmulas ou regras que nos ajudam a tirar conclusões, é imprescindível. Após tirar conclusões das análises, o cientista de dados tem que ir além e desenvolver modelos estatísticos que possam ser utilizados para agrupar, separar ou prever padrões.

Método científico

Método científico é o conjunto de técnicas usadas na pesquisa acadêmica – como os cientistas tradicionais – onde são levantadas hipóteses e elas são testadas de modo rigoroso. É um jeito de retirar o achismo das afirmações e trazer dados que nos garantem que os resultados são reais e não frutos do acaso.

Muitos falam que o cientista de dados também tem que entender de negócios. Mas acho isso meio vago. Se você trabalha em uma empresa, eu imagino que você entenda minimamente como ela funciona, quais problemas ela está tentando resolver e como traz valor para as pessoas.

Qual o salário de um Cientista de Dados?

De qualquer forma, um conjunto amplo de habilidades adicionais são necessárias: não basta apenas saber modelar ou fazer pesquisa, tem que saber programar, apresentar os resultados e convencer pessoas que geralmente acham que Python é só uma cobra.

Muitas vezes empresas requerem mestrado ou doutorado devido a necessidade de experiência em método cientifico. Afinal, os times de empresas de tecnologia possuem linhas de pesquisas internas que exploram as informações para descobrir novas ideias que possam trazer valor.

Geralmente, os salários são compatíveis com pessoas de nível sênior. Caso o cientista de dados também tenha um time de suporte (o que seria o ideal, mas raramente acontece) os salários são de nível gerencial.

A variação de salários é grande, assim como o que as empresas entendem sobre o que é um cientista de dados.

  • Um desenvolvedor que sabe estatística.
  • Um analista que gosta de algoritmos.
  • Um pesquisador que sabe programar.

Esses são três perfis diferentes e que podem ser considerados para vagas de cientista de dados a depender da empresa, da indústria e do nível de investimento da empresa em ciência de dados.

No Brasil, o salário médio (de acordo com a GlassDoor – Junho/2020) é de R$7.000,00. Porém é um mercado onde se encontram poucos cientistas de dados com a formação necessária e/ou empresas que investem pesadamente em ciência de dados.

Em grandes empresas de tecnologia como Amazon, Nubank e Facebook onde os times são mais desenvolvidos os salários ficam em torno de R$18.000,00.

Na Holanda, onde moro, os salários ficam em torno de €75.000,00 por ano. Um salário considerado alto para um cargo de contribuidor individual (aquele que não é gerente) na área de tecnologia.

Obviamente que quanto maior o salário maior a necessidade por todas as habilidades mencionadas anteriormente.

Quais são as habilidades necessárias para se tornar um Cientista de Dados?

O curso CS50 de Harvard pode ser encontrado no YouTube de graça. O certificado e a camiseta ficam por sua conta. Foto por Rohit Farmer.

Essas são as habilidades que mais uso:

  • Programação em Python, R e Java
  • Programação em SQL
  • Entendimentos sobre bases de dados relacionais
  • Entender sobre estruturas de Big Data (MapReduce, Hadoop, Spark)
  • Básico de estatística e avaliação de hipóteses (Hypothesis Testing)
  • Algoritmos de Aprendizado de Máquina (Machine Learning)
  • Apresentação de resultados (Excel e PowerPoint avançados)
  • Negociação
  • Falar em público

E claro o nosso querido inglês.

Se você não faz a menor ideia do que são esses nomes que comentei, não se preocupe. Eu aprendi praticamente tudo com a ajuda da internet. Existem muitos recursos online e de graça. Porém muitas vezes em inglês. Não conheci um cientista de dados que não soubesse o básico de inglês.

Sabendo inglês você consegue fazer cursos de Stanford (Dr. Andrew Ng – Machine Learning) e Harvard (Graduação em ciência da computação – CS50) de graça!

Está tudo ali na internet. E os certificados são a preços acessíveis. Não precisa gastar centenas de milhares de dólares para se certificar por Harvard. Basta se dedicar. E depois, se você quiser, pode planejar uma viagem para os EUA e comprar uma blusa deles (afinal sem a blusa, ninguém vai acreditar em você).

E como qualquer carreira começamos com o básico e vamos avançando. Não precisa ser um expert em tudo, apenas ter um conhecimento inicial.

Sugestão para começo de carreira:

O básico seria:

  • Python ou R ou Java avançados (pelo menos 1 dos três) – experiência de 1-3 anos programando já é avançado para mim.
  • Estatística teórica (p-test, noções sobre distribuição de probabilidade, etc).
  • Conhecimento intermediário de SQL.
  • Básico de Machine Learning (algum curso online, algumas implementações).
  • Inglês avançado.

Com isso você já se qualifica como um bom analista de dados (geralmente analistas começam com o SQL e depois aprendem Python/R). Sua facilidade com estatística, método científico e implementação de algoritmos ditará seu “fit” com a posição de cientista de dados.

E na real como funciona o dia a dia de um cientista de dados?

O dia a dia de uma cientista de dados envolve conversar com pessoas da área de negócios, entender as dores dos clientes e sair com algumas perguntas não resolvidas dessas conversas.

Por que os clientes gostam mais de X?

Como fazer os clientes comprarem mais Y?

E a partir daí tentar extrair informações para construir modelos.

O primeiro passo geralmente é conhecido como Exploratory Data Analysis (analise de dados exploratória).

Onde a cientista de dados observa os dados que tem à mão e tenta identificar padrões que possam o ajudar a responder as perguntas. Nesta parte, existe a possibilidade de interações com times de engenharia de software para “encontrar” os dados e acessa-los.

E durante esse processo, ela cria visualizações dessas informações.

Exemplo de visualização de dados. Quando os conhecimentos sobre estatística, pesquisa e programação se unem no papel do cientista de dados. Convencer pessoas com imagens é muito mais fácil. Fonte: Wikipédia.

E por fim vem a modelagem. O uso de aprendizado de máquina e técnicas de Inteligência Artificial (IA) são úteis para automatizar decisões e ações baseados na exploração feita anteriormente.

Essas técnicas permitem programar uma máquina para tomar decisões que seriam muito ineficientes se feitas manualmente (por um ser humano) e ao mesmo tempo sempre seguem algum padrão que é fácil o suficiente para um computador, ou seja, em que não se precisa pensar muito.

“Qualquer coisa que um ser humano precisa de menos de um segundo para responder, uma máquina conseguirá fazer.”

Dr. Andrew Ng

Exemplo

Por exemplo, em uma análise de dados exploratória eu posso ter encontrado uma correlação entre modelos de bicicleta, cidades e frequência de quebra.

A partir daí consigo criar um modelo que precifica descontos para bicicletas com menor frequência de quebra.

Esse modelo então é dado aos desenvolvedores do site que irão utiliza-lo na hora de mostrar o preço para os clientes.

Neste caso, eu como cientista de dados tenho que falar com os gestores da empresa para explicar toda essa relação, mostrando os dados de maneira visual e simplificada. E pela tarde tenho que falar com os desenvolvedores e mostrar o código para que eles possam colocar no site. Também tenho que monitorar a performance do algoritmos e os resultados que traz para a empresa.

Meu dia a dia como cientista de dados. Maior parte do tempo é passada programando e estudando os dados.

Na minha experiência, o dia a dia é passado maior parte nas conversas (30%), nas análises exploratórias (60% do tempo) e por fim na modelagem e implementação (10%).

Como se pode ver, é uma posição que exige uma boa parte do tempo trabalhando em cima dos números com análises e programação, mas também uma parte razoável apresentando informações e discutindo estratégias.

Em um mundo ideal, os analistas de dados se encarregariam da parte de análise fornecendo as informações de acordo com os pedidos dos cientistas de dados. Mas isso raramente acontece. Muito provavelmente por estarmos ainda no começo desta era dos dados. Conforme as empresas forem se estruturando ao redor destas áreas, haverá cada vez mais posições que auxiliam o cientista de dados:

Analistas de dados, Engenheiros de Dados, engenheiros de Machine Learning (ou engenheiros de sistema) são alguns exemplos já presentes.

Ou seja, não precisa ser cientista de dados para ter uma profissão super relevante e relacionada com informações digitais.

Como faço para me tornar um cientista de dados?

A resposta curta e grossa é: se você é uma pessoa que está começando a carreira, o jeito é aprender a programar e/ou fazendo um mestrado em área técnica (matemática, física, engenharia, etc.) que irá envolver programação de qualquer forma.

Geralmente as pessoas vêm de três perfis:

  1. Começa como desenvolvedor e aprende a parte matemática por fora (seja com cursos online ou mestrado).
  2. Começa como estatístico ou matemático e aprende a parte de programação por fora.
  3. Começa na área de negócios como analista de dados e pega experiencia com ciência através da prática e cursos online.

Minha recomendação é botar a mão na massa o quanto antes e adquirir o famoso networking ou rede de contatos. Pela minha experiencia é mais fácil ser promovido a cientista de dados após alguns anos ralando em cima de dados como um analista de dados. Ou saindo direto da área acadêmica após um doutorado onde você passou anos programando e analisando dados de pesquisas.

É uma carreira extremamente empolgante com um quê de descobridor quase que como resolver o quebra-cabeça dos dados. Empresas estão cada vez mais contando com estes profissionais para trazer melhores experiencias para seus clientes e tornar negócios mais eficientes.

Perfil: Negócios ou Tecnologia da Informação (TI)?

Nas empresas que conheci existem basicamente dois tipos: as em que o cientista de dados é uma pessoa de TI (técnica) e as modelagens exigem conhecimentos avançados software. E as em que o time de dados fica mais conectado à área de negócios.

A primeira exige uma experiencia como desenvolvedor e ou pesquisador. Já a segunda, exige uma experiencia como analista. Nestas mesmas empresas existem times de BI (Business Intelligence, Inteligência de Mercado) ou de Data Analytics onde os colaboradores ficam mais próximos das áreas de negócios.

O perfil será ditado por onde vem o investimento na área. Eu vejo muito a posição de Cientista de Dados como um híbrido entre tecnologia e negócios. Um pé lá e um pé cá.

Se você gosta o suficiente de negócios para não querer ser um desenvolvedor ou gosta o suficiente de programação para não ser um analista de negócios. Talvez seja uma opção a se considerar.

Cabe a você fazer uma avaliação da sua carreira e ver em que pé se encontra.

Conclusão

O cientista de dados transita entre a área de tecnologia e negócios. Nem lá nem cá, mas sempre influenciando ambos os lados. Foto por Jon Flobrant.

Eu comecei com o mestrado, depois trabalhei como cientista de dados e hoje dou consultoria na área com uma pegada mais estratégica. Adoro programar e é uma atividade diária para mim que faço com muito prazer.

Porém, o grau de afinidade com a programação versus negócios é o que ditará sua carreira. Cientistas de dados são pessoas com grande foco técnico que amam matemática e programação. Se você, assim como eu, se vê mais trabalhando com negócios, no entanto sendo mais analítico recomendo olhar a carreira de analista de dados. Que será assunto do próximo post.

Existem muitas possibilidades de trabalho que exigem menos experiência para quem está começando. Algumas empresas estão começando a estruturar seus times de dados com um mix de analistas e tentando extrair resultados de negócios a partir dos dados. O que é uma ótima opção para quem quer se desenvolver na carreira com alta exposição à diretoria de uma empresa.

O maior risco desta área é o alto custo de investimento que muitas vezes pode ser comparado ao R&D onde empresas contratam cientistas e pesquisadores para descobrir o próximo produto que irá revolucionar a indústria.

Em tempos de crise, essas áreas são as primeiras a serem cortadas. A profissão de cientista de dados pode levar muitos a focarem na ciência e arte do descobrimento e deixar de lado a questão de negócio, mas no final do dia, o que paga o salário é o resultado (valor) para o cliente final. Focar no modelo esquecendo do impacto financeiro é um erro comum. Por isso um conhecimento sobre inovação e método ágil é extremamente importante.

O salário é algo que vem com a carga de conhecimento. Cientistas de dados podem ganhar centenas de milhares de reais por ano, porém precisam se dedicar constantemente à pesquisa e estudos. Se você se vê como um eterno aprendiz moderno (aquele que aprende na prática) então talvez seja a carreira para você.

Uma carreira que pode ser extremamente fácil de se internacionalizar dada a alta demanda por profissionais dessa área. Mesmo com Donald Trump bloqueando o acesso ao H1B visa (visto de trabalho nos EUA) recentemetne, ainda existem milhares de vagas tanto presenciais como remotas. Portanto, entre um modelo e outro é bom dar uma conectada com pessoas na sua rede de contatos e manter o LinkedIn atualizado.

Comente aqui embaixo se você pretende ser cientista de dados. E se você está começando e quer aprender a programar e ter uma carreira em dados, estarei publicando uma sequencia de posts sobre o assunto.

3 comentários em “O que faz um cientista de dados?

  1. Eduardo Feitosa Ramos

    Matéria muito boa Jean, parabéns!!!

    Curtido por 1 pessoa

  2. Pingback: O que faz um cientista de dados? — Aprendiz Moderno – SimuleAgora.com

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

%d blogueiros gostam disto: