• Data Hackers Newsletter
  • Posts
  • Cientista de Dados x Analista de Dados: Quais as diferenças e o que cada um faz no dia a dia?

Cientista de Dados x Analista de Dados: Quais as diferenças e o que cada um faz no dia a dia?

Entenda as principais diferenças entre as duas funções mais populares em times de Data Science e Analytics, compreenda o potencial de cada uma delas e descubra as habilidades necessárias para se tornar um Cientista de Dados, um Analista de Dados e o potencial de cada uma dessas carreiras.

Nos últimos anos o mercado aumentou muito o investimento em equipes de dados, buscando extrair mais valor das informações e tomar melhores decisões no dia a dia das empresas. Esse movimento tem feito a área de dados evoluir rápido, o que levou ao surgimento de novas profissões e especializações, como Data Scientist/Cientista de Dados [DS], Data Analyst/Analista de dados [DA], Data Engineer/Engenheiro de Dados [DE], Data Product Manager [DPM], Machine Learning Engineer [MLE], Analytics Engineer [AE] e muitas outras (repare também que o mercado de tecnologia adora usar siglas , o que aumenta ainda mais a confusão para quem está começando 😂)

Apesar de cada uma das profissões citadas ter suas próprias características e responsabilidades, algumas dessas especializações ainda são muito novas, o que pode levar a dificuldades no entendimento do que cada uma faz.

Como estou há muitos anos atuando na área de dados, uma das dúvidas que mais vejo é sobre as diferenças entre o que faz um analista de dados e um cientista de dados. Escrevi esse post para tentar esclarecer de uma vez por todas como é o dia a dia de cada um desses profissionais em uma equipe de Data & Analytics.

Mas primeiro uma dica! Inscreva-se gratuitamente na newsletter do Data Hackers para receber gratuitamente em seu email as principais novidades da área de dados.

Mas afinal, quais as diferenças entre Data Scientists [DS] e Data Analysts [DA]?

Quando a área de dados começou a ficar popular, existia muita confusão sobre o que cada papel deveria fazer no dia a dia. Influenciadas pelo hype, empresas que ainda não tinham nenhuma maturidade analítica começaram a contratar profissionais de dados, o que deixava tudo ainda mais obscuro: muitas vezes a empresa contratava um cientista de dados com o objetivo de fazer estudos de alta complexidade, mas os dados da empresa ainda estavam muito pouco organizados, o que levava o cientista a fazer o trabalho do analista ou do engenheiro de dados.

Meme onde uma vaquinha fica perdida entre as opções de Cientista e Analista de dados, mas no fim o único caminho é trabalhar com Excel.

Só para esclarecer, na área de dados é bem comum existirem sobreposições de papéis. É normal uma startup começar sua área de dados com uma pessoa mais generalista, uma espécie de "faz tudo", e ir ampliando a equipe e especializando os papéis à medida que for ganhando mais maturidade. Mesmo em empresas muito grandes é natural que às vezes o Analista de Dados atue em alguns projetos num papel muito semelhante a um Cientista de Dados (sim, o analista de dados também pode utilizar técnicas de Machine Learning e Estatística no dia a dia, isso é bem comum). Outra situação comum é tanto o DS quando o DA acabarem enfrentando cenários onde os dados são pouco acessíveis, o que geralmente vai exigir que gastem uma boa parte do tempo fazendo ETLs, Pipelines e consultas complexas, um trabalho mais na linha do dia a dia de um Engenheiro de Dados.

Meu objetivo ao longo desse post é mostrar as principais diferenças entre as disciplinas e o que geralmente uma empresa procura quando abre uma nova posição para Cientista ou Analista de Dados. Não quero ser o dono da razão, muito menos a pessoa que vai proibir ou criar regras sobre o que você pode ou não fazer no seu dia a dia ou na sua empresa, ok?

Eu acredito que, com o volume de informações disponíveis hoje na internet, os profissionais têm que se adaptar para gerar impacto nas empresas, e os nomes de cargos, habilidades e especializações são meios de ajudar as pessoas a entender e impulsionar isso, não o contrário.

Dica de carreira: Não seja a pessoa que fala: "Eu sou um Cientista de Dados e não vou fazer isso pois é um trabalho de Engenheiro de Dados". Em vez disso, mostre para seu stakeholder ou líder como vocês poderiam estruturar melhor a área, e como você poderia gerar mais resultados se tivesse o apoio de alguém mais experiente em engenharia de dados no projeto.

Bom, voltando ao objetivo inicial, para entendermos as diferenças entre Cientistas de Dados e Analistas de Dados, vamos abordar os seguintes tópicos:

  • O papel de cada profissão em um time de dados

  • Responsabilidades de Cientistas e Analistas de Dados no dia a dia

  • Habilidades mais comuns em cada posição

  • Ferramentas e tecnologias mais usadas em cada contexto

  • Como é o mercado de trabalho para cada profissional

  • O que você deveria aprender para se tornar um Cientista ou um Analista de Dados

  • Dicas para crescer na carreira em ambas profissões

Qual é o papel de um Analista de Dados?  E de um Cientista de Dados?

Entendendo o papel do Analista de Dados

Um Analista de Dados é responsável por cruzar e explorar diferentes fontes de dados com o objetivo de ajudar a organização a tomar melhores decisões.

Foto de um analista de dados com destaque para as habilidades: SQL, Dashboards, Modelagem de Dados e Visualização de Dados.

Suas principais funções incluem:

  1. Entendimento dos dados: Geralmente o trabalho de um Analista de Dados tem início com o surgimento de oportunidades trazidas pela área de negócios. Essas oportunidades aparecem  na forma de problemas que estão acontecendo no dia a dia, resultados inesperados ou novos comportamentos e tendências. Com esse desafio em mãos, o DA vai precisar fazer um processo de entendimento das fontes de dados disponíveis e planejar como obter as informações da melhor maneira possível.

  2. Coleta de Dados: Reunir dados de diversas fontes, incluindo bancos de dados internos, APIs e fontes externas em um local centralizado, cruzando essas informações de forma lógica.

  3. Limpeza e Preparação de Dados para análise: Garantir que os dados estejam livres de erros e prontos para análise, corrigindo dados faltantes, preenchimentos incorretos, formatos  e outros problemas decorrentes da importação de dados ou de integrações. Outro problema comum é que os dados não estejam modelados de uma forma que facilite as análises: nesse caso, será necessário utilizar técnicas de modelagem de dados, como ETLs, views etc.

  4. Análise Descritiva: Utilizar técnicas de análise estatística e de visualização de dados para identificar padrões, tendências e anomalias nos dados, com  foco em levantar perguntas que sejam importantes para a área de negócio.

  5. Geração de Relatórios: Criar relatórios e dashboards que facilitem o entendimento e a reprodutibilidade das análises, além de comunicar as descobertas aos stakeholders de forma clara e objetiva. É muito comum que apareçam novas perguntas assim que o analista comunicar as descobertas, por isso é importante que o dashboard tenha filtros e cruzamentos que garantam maior flexibilidade para quem estiver analisando os dados.

  6. Suporte à Tomada de Decisões: Ajudar a organização a entender os dados e a tomar decisões baseadas em evidências.

Entendendo o papel do Cientista de Dados

Um Cientista de Dados, por outro lado, trabalha em um nível mais avançado de análise e modelagem de dados, com um foco maior em testar hipóteses e aplicar técnicas de Machine Learning e Estatística.

Foto de uma cientista de dados com destaque para as habilidades: Python, SQL, Estatística e Machine Learning.

Suas responsabilidades incluem:

  1. Entendimento do problema: Geralmente o trabalho de um Cientista de Dados tem início a partir de demandas de negócios,  como oportunidades de utilizar técnicas de Machine Learning para otimizar um processo, identificar padrões ocultos ou reduzir riscos. Após o entendimento, o Cientista vai precisar pensar em quais as técnicas mais adequadas para resolver esse problema em específico.

  2. Coleta de Dados: Reunir dados de diversas fontes, incluindo bancos de dados internos, APIs e fontes externas em um local centralizado, cruzando essas informações de forma lógica.

  3. Exploração e preparação dos Dados para o desenvolvimento de modelos: Realizar a análise exploratória dos dados, conduzindo uma abordagem ao cruzá-los e investigá-los  antes de aplicar qualquer técnica estatística. O objetivo é obter um entendimento básico dos dados e das relações entre as variáveis analisadas. Esse processo vai ajudar a  identificar padrões, comportamentos ocultos, anomalias e a fornecer insights para tomadas de decisão e desenvolvimento de modelos preditivos.

  4. Desenvolvimento de modelos de Machine Learning: Existe uma série de técnicas estatísticas e modelos de ML e cada uma delas deve ser aplicada para resolver problemas específicos. Sendo assim, grande parte do trabalho do Cientista de Dados consiste em escolher qual técnica utilizar e realizar os procedimentos necessários para aplicá-la. Isso vai envolver o desenvolvimento de algoritmos, geralmente através de uma linguagem de programação (Python / R / Julia são as linguagens mais comuns, mas é possível utilizar outras). 

  5. Validação dos modelos: Após o desenvolvimento dos modelos é necessário um processo de validação, geralmente aplicando o modelo em conjuntos de dados não utilizados para treinamento e avaliando os indicadores de eficácia. O objetivo é garantir que o modelo  apresente métricas que indicam sucesso quando for colocado em produção.

  6. Comunicação de Resultados: Apresentar as conclusões do processo de modelagem, traduzindo as descobertas complexas em insights acionáveis, avaliando os potenciais ganhos do uso das técnicas no contexto de negócio e o caminho necessário para colocar o modelo em produção.

Reparem que existem muitas semelhanças entre o papel de um analista de dados e de um cientista de dados no dia a dia: ambos têm que coletar, manipular e analisar grandes volumes de dados, e nos dois casos existe um importante trabalho  envolvendo comunicação e alinhamento com as áreas de negócio. Essas semelhanças são ainda mais evidentes em equipes pequenas e em empresas com menor maturidade analítica. 

Vamos tentar entender melhor as responsabilidades de cada uma das funções para deixar as diferenças mais claras.

Quais as responsabilidades de um Cientista de Dados e como elas diferem das de um Analista de Dados?

A diferença entre um analista de dados e um cientista de dados resulta da natureza das atividades que desempenham. Enquanto o trabalho de um analista de dados é predominantemente exploratório, o de um cientista de dados é essencialmente experimental.

Para entender melhor as diferenças, vamos esclarecer os tipos de análises de dados mais comuns no dia a dia das empresas através da "cadeia de valor em analytics”.

Imagem da cadeia de valor em analytics

  • Análise Descritiva [O que aconteceu?]: A análise descritiva geralmente vai focar no entendimento de um fato que já ocorreu. Ela vai fornecer insights sobre esse fato ​​ao  analisar padrões, tendências e anomalias de dados históricos. Por exemplo, diante de um cenário de queda nas vendas, entender os fatos relacionados a essa queda, e entender os movimentos de mercado.

  • Análise Diagnóstica [Por que isso aconteceu?]: A análise diagnóstica tem como objetivo entender o que levou um fato a acontecer. Para isso podem ser realizadas comparações e cruzamentos de diferentes conjuntos de dados, filtrando diferentes comportamentos em busca de identificar as causas relacionadas. Por exemplo: diante de um cenário de queda nas vendas, identificar fatores que influenciaram essa queda ou estiveram diretamente relacionados a ela.

  • Análise Preditiva [O que poderá acontecer no futuro?]: Como o nome sugere, esta categoria de soluções emprega modelos de machine learning para tentar prever o que pode acontecer no futuro, com base em tendências e comportamentos já observados no passado. Por exemplo, diante de um cenário de queda nas vendas, tentar compreender se há uma tendência de queda no futuro ou se foi um efeito sazonal. Outra possibilidade é tentar medir o quanto os principais fatores relacionados a essa queda podem influenciar nos resultados futuros.

  • Análise Prescritiva [Como podemos influenciar para que isso aconteça?]: A análise prescritiva usa os resultados da análise descritiva e preditiva para recomendar ações específicas  visando influenciar resultados. Utilizando técnicas como simulação, otimização e algoritmos de machine learning, a análise prescritiva fornece orientações sobre decisões que podem ser tomadas para alcançar um determinado objetivo ou resolver um problema em específico. Por exemplo: diante de um cenário de queda nas vendas, entender o que precisa ser modificado para reverter esse cenário e entender o que provavelmente aconteceria depois de realizar diferentes ações.

Reparem que enquanto a análise descritiva e análise diagnóstica basicamente olham para fatos e dados que já ocorreram no passado, com o intuito de identificar padrões, as análises preditiva e prescritiva tentam encontrar formas de modelar e estimar o que ainda vai acontecer no futuro. É exatamente por esse motivo que que análises preditivas e prescritivas dependem tanto de estatística e machine learning [ML].

Imagem da cadeia de valor em analytics com uma separação entre análises que olham para o passado e outras que olham para o futuro

Voltando ao dia a dia das empresas e as diferenças entre os profissionais, um analista de dados realiza a extração e cruzamento de diferentes conjuntos de dados que empregam análises descritivas e diagnósticas para facilitar o entendimento dos fatos, geralmente levantando ainda mais perguntas sobre o cenário analisado à medida que faz novas observações.

Já um cientista de dados cobre toda a jornada analítica, concentrando-se principalmente na análise preditiva e no desenvolvimento de modelos estatísticos e algoritmos de machine learning que vão ajudar a automatizar o processo de tomada de decisão em cenários de incerteza.

Outra grande diferença está no nível de experiência no manuseio de dados. Um cientista de dados precisa ter maior proficiência em técnicas avançadas de programação e Machine Learning com o foco na construção de algoritmos. Já um analista de dados vai precisar ter mais experiência técnica em consulta e modelagem de dados e em aplicar técnicas de Business Intelligence (BI), análise de dados e construir dashboards para que as áreas de negócio tenham mais autonomia sempre que desafios semelhantes voltarem a aparecer no futuro.

Quais as habilidades e conhecimentos técnicos necessários para um Analista de Dados? e para um Cientista de Dados?

Qualquer profissional que pretenda trabalhar com análises avançadas de dados no dia a dia vai precisar desenvolver uma série de habilidades específicas e obter experiência prática com o uso de ferramentas que vão possibilitar maior eficiência e produtividade nas análises.

Habilidades e ferramentas fundamentais para as duas profissões:

  • Linguagem SQL e habilidades em consulta e extração de dados;

  • Conhecimentos em programação, preferencialmente na linguagem Python ou R;

  • Habilidades em manipulação de grandes volumes de dados;

  • Experiência em técnicas de análise de dados;

  • Conhecimentos em Visualização de Dados e Data Storytelling;

Habilidades e ferramentas mais comuns para Analistas de Dados:

  • Conhecimentos mais avançados de consulta a dados como tuning de consultas, views materializadas, desenvolvimento de ETLs e pipelines de dados;

  • Técnicas específicas em ferramentas de Business Intelligence como pré-processamento de dados, otimização de filtros e cruzamentos de diferentes fontes de dados;

  • Modelagem de dados (OLAP);

  • Habilidades na construção de Dashboards;

Fonte: www.stateofdata.com.br

Habilidades e ferramentas mais comuns para Cientistas de Dados:

  • Testes de hipótese e experimentação;

  • Modelagem estatística;

  • Modelos de Machine Learning (supervisionados, não-supervisionados, aprendizagem por reforço);

  • Modelos de Deep Learning e LLM's;

  • Conhecimentos em desenvolvimento de software (git, testes, boas práticas, monitoramento, documentação);

  • Conhecimentos em cloud computing;

Fonte: www.stateofdata.com.br

É importante reforçar que utilizamos os dados da pesquisa State of Data Brazil, para mapear quais as habilidades mais comuns entre profissionais de dados. A última edição da pesquisa ocorreu no final de 2023 e contou com a participação de mais de 5,2 mil profissionais de dados. Você pode inclusive baixar os dados da pesquisa e fazer suas próprias análises, acesse o site www.stateofdata.com.br para saber mais.

Como já falado no início, existem muitos pontos de interseção entre os dois papéis, e essas habilidades podem mudar dependendo do contexto e maturidade da empresa. Nada impede um analista de dados de utilizar modelos de Machine Learning no dia a dia, assim como não há impedimentos em um cientista de dados fazer uma entrega no formato de um dashboard. É possível inclusive alimentar um dashboard com informações obtidas em modelos de machine learning e não há nada errado nisso.

O objetivo pelo qual o mercado foi buscando a especialização dos profissionais foi tanto ter mais produtividade no dia a dia quanto facilitar a formação dos profissionais, uma vez que são áreas de grande complexidade técnica. No início as empresas tentavam buscar profissionais que dominavam tudo de todas as frentes de dados, os chamados profissionais "unicórnio", e existe um motivo para terem dado esse nome: são profissionais tão difíceis de se encontrar  quanto um unicórnio.

E como está o mercado Brasileiro de Dados? Existem muitas vagas de emprego para Analistas de Dados? E para Cientistas de Dados?

A área de dados vem crescendo no Brasil e no mundo desde 2015, e foi muito impulsionada pelo "boom" ocasionado pela pandemia e isolamento social,  que forçou inúmeras empresas a fazerem um processo de digitalização  de emergência em um curto intervalo de tempo. Um maior número de empresas com foco em soluções digitais somado a um grande volume de dados sendo gerado a todo instante criou um cenário muito positivo para a maioria dos profissionais que atuam nessa área, o que inclui Analistas, Cientistas e Engenheiros de Dados.

A área de Análise de Dados é a que mais emprega profissionais de dados no Brasil: de acordo com dados do Linkedin, ao final de 2023 existiam 18.994 profissionais com o cargo Analista de Dados atuando em nosso país (sabemos que esse número tende a ser maior pois o Linkedin não engloba 100% dos profissionais de Brasil, e é provavelmente pouco representativo em alguns setores da economia como  o setor público, por exemplo). Apesar disso, essa área teve um crescimento de 13% no último ano, e um índice de rotatividade (pessoas trocando de emprego) de 30%.

Resumo do mercado brasileiro de Analistas de Dados.

Um dado interessante e comprovado pela última edição da pesquisa State of Data Brazil é que devido ao aquecimento do mercado de trabalho em dados, uma grande parte dos profissionais tenta trocar de emprego todos os anos, seja por uma migração de carreira ou por buscar oportunidades em outras empresas. No último ano mais de 50% dos profissionais de dados participaram de entrevistas de emprego, e mais de 20%  deixaram seus postos antigos e entraram em novos.

A área de Ciência de Dados apresenta um número menor de profissionais quando comparado a Análise de Dados. Acredito que isso se deva ao fato de ser uma área mais específica e mais nova, além de que a  demanda por Cientistas de Dados é mais  frequente em empresas com maior maturidade analítica, devido  à complexidade das análises. Segundo o Linkedin, atualmente existem cerca de 7.704 profissionais com o cargo de Cientista de Dados no mercado brasileiro.  Ainda que os números não necessariamente empolguem, é um mercado que vem passando por um crescimento constante ao longo dos anos.

Resumo do mercado brasileiro de Cientistas de Dados.

Outro fator interessante de se observar em análises do mercado é quão aberto o mercado de trabalho está para novos profissionais. Para isso, podemos voltar às tabelas apresentadas anteriormente sobre o Raio-X dos profissionais de dados: vemos que, tanto para Cientistas quanto para Analistas de Dados, quando olhamos apenas as colunas referentes a profissionais de nível júnior mais de 40% dos profissionais tem menos de um ano de experiência na área, o que aparentemente mostra que o mercado ainda tem um bom espaço para novos profissionais e que o crescimento na carreira ainda é rápido quando comparado a outras profissões, pois mais de 46% dos profissionais de nível pleno tem menos de 2 anos e mais de 40% dos profissionais de nível sênior tem 4 anos ou menos de experiência.

O que é necessário aprender em cada uma dessas profissões?

Se você chegou até aqui e está interessado em se especializar em alguma das carreiras que apresentamos acima, uma boa estratégia para entender o que é preciso aprender para planejar os próximos passos na área é se basear em "Roadmaps de Carreira". 

Obs: É importante lembrar que a área de dados é ainda muito nova, e as habilidades necessárias para cada papel ainda podem variar muito dependendo do contexto da empresa, considerando mercado de atuação, tamanho  e novas tecnologias em destaque. Então lembre-se que um roadmap é apenas uma referência, não está "escrito em pedra" e o ideal é que com o passar do tempo você crie o próprio roadmap de carreira que faça mais sentido para você.

Porém como referência vamos apresentar dois roadmaps que acreditamos que estão atuais e que foram construídos com o apoio de uma grande comunidade e disponibilizados de forma aberta no site https://roadmap.sh/ (existem roadmaps de várias carreiras de tecnologia no site deles, vale a pena conferir).

Roadmap Analista de Dados [DA]

Roadmap Analista de Dados [DA] parte 1

Parte 1 do roadmap para analistas de dados, foco em SQL, Excel e Programação.

De uma forma bem resumida, no início dos estudos como analista de dados é interessante obter conhecimentos em Excel, SQL e uma linguagem de programação (nós indicamos Python pois é uma linguagem muito utilizada por diversos profissionais de dados, como Cientistas , Engenheiros , Analytics Engineers e Machine Learning Engineers), Isso deve facilitar sua vida no futuro (e até abrir as portas para outras especializações).

Roadmap Analista de Dados [DA] parte 2

Parte 2 do Roadmap para analistas de dados, foco em: Análise de dados, Visualização de dados e análise estatística .

Num segundo momento, depois de se aperfeiçoar nas habilidades básicas, conhecimentos relacionados à manipulação e processamento de dados, análise de dados, à visualização de dados e à estatística aplicada serão muito bem-vindos.  É importante reforçar que esses são os conhecimentos que mais vão gerar valor no trabalho de um analista de dados, aumentando o impacto desse profissional nas empresas. A parte um concentra-se mais no ferramental e a parte dois em habilidades de análises.

Roadmap Analista de Dados [DA] parte 3

Parte 3 do Roadmap para analistas de dados com o foco em: Machine Learning, Big Data e Deep Learning (opcional).

Uma vez que você entenda que já obteve proficiência nos itens apresentados na parte 1 e 2, pode ser interessante buscar outros conhecimentos de áreas mais específicas, mas nesse caso é importante ter mais clareza sobre quais as áreas nas quais você tem mais interesse ou vê uma maior oportunidade de aumentar seu impacto. Conhecimentos em Big Data/Arquitetura de Dados são muito explorados por Data Engineers e Analytics Engineers, e muito úteis para analistas de dados que desejam ter maior capacidade e autonomia para operar e analisar grandes volumes de dados. Os conhecimentos em Machine Learning e Deep Learning, por sua vez, são mais comuns para cientistas de dados, e mais relevantes para analistas que desejam aumentar a complexidade e impacto de suas análises. 

Um ponto relativamente novo (não incluído nesse Roadmap) mas que pode ser interessante para analistas de dados que buscam se atualizar são as habilidades em LLM's e AI Generativa, que estão abrindo uma série de novas oportunidades de análises e se mostrando muito úteis para solucionar uma série de problemas de negócios.

Roadmap Cientista de Dados [DS]

Roadmap Cientista de Dados [DS] parte 1

Parte 1 do Roadmap em Data Science, foco em: Matemática, Estatística e Econometria.

Os conhecimentos em Data Science também começam pela base. Porém, ao contrário do Analista de Dados que geralmente começa aprendendo a utilizar as ferramentas, no caso do Cientista de Dados é mais comum iniciar com uma base teórica, geralmente  conhecimentos em matemática e estatística, incluindo álgebra, cálculo, testes de hipóteses e inferência estatística. 

Depois dessa parte inicial teórica, o roadmap apresenta uma parte pouco comum no Brasil, que é o foco em econometria (foram raros os casos que eu vi Cientistas de Dados estudando econometria no Brasil) Porém por sorte, esse é um assunto que posso opinar com um pouco mais de propriedade uma vez que  tenho formação superior em Ciências Econômicas e Estatística…🤣. Na minha visão o que esse Roadmap apresenta como Econometria são alguns conhecimentos avançados em estatística (comumente utilizados em análises econômicas) como Time Series (análise de séries temporais), Forecasting (previsões financeiras) e Regressão Linear. Resumo: Apesar do nome Econometria, são análises estatísticas um pouco mais avançadas, porém muito comuns no dia a dia  dos Cientistas de Dados.

Roadmap Cientista de Dados [DS] parte 2

Parte 2 do roadmap em Data Science com o foco em: Desenvolvimento de software, Análise Exploratória (EDA) e Machine Learning.

Após o aperfeiçoamento dos conhecimentos básicos, a parte dois foca em habilidades mais práticas, como desenvolvimento de software, algoritmos, Análise Exploratória (EDA) e Machine Learning. Embora o Roadmap de DS não dê muita ênfase nos conhecimentos relacionados a código, sólidos conhecimentos em Python (ou R) e SQL são requisitos básicos para qualquer profissional que deseja se tornar um Cientista de Dados.

Roadmap Cientista de Dados [DS] parte 3

Parte 3 do roadmap em Data Science, foco em: Machine Learning, Deep Learning e MLOps.

Por fim, após um domínio mais profundo das ferramentas e conhecimentos práticos, a parte 3 foca mais em conhecimentos avançados como Machine Learning, Deep Learning e MLOps. Novamente gostaria de reforçar a necessidade de entender a fundo LLMs e  IA Generativa, uma vez que a solução de muitos problemas envolvendo Data Science &  IA mudaram radicalmente com a chegada dos Large Language Models.

Dicas para crescer na carreira em ambas as profissões

Acredito que com os conhecimentos compartilhados até aqui, você  tem agora um entendimento mais claro das diferenças existentes nos  papéis de analistas e cientistas de dados nas organizações (e espero que me ajude a explicar para o mercado que não se trata da mesma coisa, e que um Cientista de Dados não é uma evolução de senioridade de um Analista de Dados, mas que são  papéis diferentes que costumam atuar em conjunto).

Apesar das diferenças  entre as profissões existe um fator que se mantém igual para Analistas e Cientistas de Dados, e está fortemente relacionado a evolução de carreira:  A necessidade de desenvolver Soft Skills.

Lembre-se sempre que todos os conhecimentos técnicos citados até aqui vão ajudar os profissionais a conquistar oportunidades no mercado de trabalho, porém são as Soft Skills que vão ter o maior impacto na carreira desses profissionais depois que estiverem atuando nas empresas. 

Soft Skills são geralmente habilidades comportamentais e interpessoais que afetam a maneira como as pessoas interagem umas com as outras e com o ambiente de trabalho. Ao contrário das hard skills, que são competências técnicas e específicas de uma profissão, as soft skills são mais amplas e se aplicam a diversas situações e contextos. Elas são essenciais para o sucesso profissional e pessoal, pois influenciam diretamente a capacidade de um indivíduo de trabalhar bem em equipe, se comunicar com os colegas e o mais importante: resolver problemas.

As principais soft skills que acredito que um profissional de dados precisa desenvolver são:

  • Habilidades de comunicação e apresentação: O mundo dos negócios vai te ensinar muito sobre comunicação. Quase ninguém vai se importar com a metodologia e técnicas complexas que você utilizou para chegar a uma conclusão de análise. Uma análise ótima e mal apresentada vai gerar zero impacto para o negócio, uma vez que ela só vai gerar valor se as pessoas se engajarem em utilizar os resultados para realizar alguma ação. Aquele seu projeto estilo TCC da faculdade de 500 páginas, não vai te ajudar em nada no mundo corporativo: pelo contrário, se você continuar trabalhando dessa forma será quase impossível engajar as pessoas e atrair atenção para o seu trabalho. Comunicar e apresentar bem suas ideias, análises, conclusões e sugestões vai ser a chave para aumentar o impacto (e a utilidade) do seu trabalho no dia a dia.

  • Habilidades de negociação e vendas: Um sentimento bem comum em profissionais de dados é o de trabalharem numa pastelaria. A cada minuto chegam novas demandas, e por mais que você seja rápido nas entregas, a velocidade  da chegada de novos pedidos será ainda maior. Isso só vai mudar se você souber negociar com seus stakeholders, e mostrar para eles que o impacto do seu trabalho pode ser muito maior se você atuar de uma outra forma. E você só vai conseguir mudar esse cenário com muita habilidade de negociação. Além disso, preciso te contar outra verdade… Sabe aquele insight genial que você descobriu ao cruzar os dados de vendas? Ele só vai gerar valor se você convencer alguém que ele é relevante. Sem habilidades de negociação e vendas a vida de um profissional de dados fica bem mais difícil devido a todas essas limitações.

  • Pensamento crítico e resolução de problemas: Resolver problemas vai muito além de seguir uma fórmula ou framework: a maioria das perguntas de negócio serão muito complexas, afinal se a solução fosse fácil, as pessoas nem mesmo procurariam um profissional de dados e tentariam resolver tudo sozinhas. Muitas vezes a vida de um profissional de dados mais parece com a de um detetive, e saber resolver problemas talvez seja uma das principais habilidades que darão destaque a um profissional de dados.

  • Curiosidade e Adaptação: É difícil pensar num mundo que passe por mais mudanças que o mundo de um profissional de dados. Todos os dias surgem novas tecnologias, novas ferramentas, novas aplicações e novas soluções para antigos problemas. Nos últimos 5 anos surgiram pelo menos 10 novas profissões, e já perdi a conta de quantas vezes a forma de resolver problemas mudou radicalmente. Sendo assim é muito importante que um profissional de dados esteja sempre aberto ao novo, tenha muita humildade para ouvir e aprender com os outros, e tenha disposição para se adaptar e reinventar (caso contrário, o mais provável é que se torne um "dinossauro" ou uma peça obsoleta em muito pouco tempo).

Bom… Espero que este artigo tenha te ajudado a esclarecer as diferenças entre Cientistas de Dados e Analistas de Dados. Se você está considerando uma carreira na área de Dados, meu conselho é que reflita sobre onde suas habilidades e interesses mais vão se alinhar, e fique tranquilo pois no início os aprendizados e forma de trabalho desses dois papéis serão bem parecidos, o que é ótimo pois vai te permitir testar, praticar e entender o que você mais gosta de fazer.

Outro ponto positivo é que, por se tratar de um mercado aquecido, nada te impede de migrar de uma carreira para outra, ou atuar em uma empresa que precise de uma pessoa mais generalista e capaz de trabalhar com as duas disciplinas.

Por fim, seja qual for sua escolha, a área de dados ainda oferece um mercado em expansão e um futuro promissor para quem estiver disposto a correr e se desenvolver.

Se quiser conhecer mais sobre a área de dados e ficar por dentro das principais novidades, assine gratuitamente a newsletter semanal do Data Hackers: você vai receber toda segunda em seu email as principais novidades da área  de forma organizada e resumida!

Um grande abraço e até o próximo artigo!