- Data Hackers Newsletter
- Posts
- 5 lições (que você ainda não pratica) que vão te ajudar a se tornar um profissional de dados acima da média! 😉
5 lições (que você ainda não pratica) que vão te ajudar a se tornar um profissional de dados acima da média! 😉
5 lições da área de negócios que vão te ajudar a se tornar um profissional de dados de maior impacto nas empresas
E aí Data Hackers! Preparados para mais uma semana recheada de dados?Machine Learning, Deep Learning, Python ou R, ETL's e SQL são alguns dos itens que não podem faltar no currículo de um bom profissional de dados, certo? Mas e se eu te disser que (infelizmente) não são essas habilidades que vão fazer com que você se destaque no mercado de trabalho?Ficou confuso? (Lá vem os Data Hackers falando para eu aprender ainda mais coisas novas...) Pois fique tranquilo, hoje o conteúdo principal que vamos trazer é exatamente sobre isso, vamos compartilhar com você 5 lições práticas que podem aumentar consideravelmente o impacto de um profissional de dados nas empresas.Mas não é só isso, vamos levantar uma polêmica sobre um "descasamento" entre o que os profissionais de ML sonham em fazer e o que as empresas realmente precisam; Vamos dar dicas de como utilizar o DBT para transformações de dados; Apresentar 2 competições de ML que acabaram de ser lançadas com prêmios incríveis e foco em brasileiros e latino-americanos; Compartilhar um livro (grátis) sobre como passar em entrevistas de Machine Learning e muito mais.
Eu já perdi as contas de quantas vezes vi profissionais de dados que tinham um excelente currículo e vastos conhecimentos técnicos mas que quando entraram para o mercado de trabalho não conseguiram agregar valor as empresas. Isso é bem mais comum do que pensamos.
O processo de análise de dados passa por diversas etapas que não são sequer abordadas nos cursos de tecnologia, como por exemplo técnicas de organização de ideias, comunicação, explicação do que foi analisado e "venda de ideias". Talvez por isso seja tão comum encontrar profissionais com sólidos conhecimentos técnicos, mas que na prática não conseguem provocar impactos nas empresas e se tornam analistas cada vez mais caros para os negócios.
Pensando nisso Tessa Xie escreveu um artigo bem interessante onde ela utiliza os aprendizados de negócios que teve como consultora da McKinsey e resolveu aplica-los nas principais rotinas de um profissional de dados. Ela resumiu tudo isso em 5 dicas imperdíveis que envolvem uma melhor organização de ideais, comunicação, defesa de pontos de vista e convencimento de outras pessoas envolvidas nos projetos. Além das lições ela apresenta algumas dicas de como praticar os pontos apresentados no dia a dia e se aperfeiçoar em cada um deles. (em Inglês)
Objetivo:
Criar um modelo para prever quantos dias o estoque de itens do Mercado Livre vão durar com base nos dados históricos da empresa.
Premiação:
1º Lugar: NOTEBOOK LENOVO LEGION 5I + Monitor Samsung F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference
2º Lugar: NOTEBOOK ASUS ROG STRIX G512LI + Monitor Samsung F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference
3º Lugar: MONITOR SAMSUNG F390 27” + 100 USD credits for AWS/Google Cloud + Ticket for NeurIPS virtual conference
4º ao 10º Lugar: TICKET FOR NEURIPS VIRTUAL CONFERENCE
Obs: Prêmios apenas para residentes da Argentina, Brasil, Chile, Colômbia, México e Uruguai.
Objetivo:
Promover a ciência de dados para prover soluções e melhorias para as condições dos serviços de saúde da população com deficiência do Brasil.
Obs: As soluções desse Hackaton vão colaborar diretamente com a melhoria dos Centros de Reabilitação do Brasil, apoiando as oficinas ortopédicas, Sistema Único de Saúde (SUS) e Centros Especializados em Reabilitação (CER).
Premiação:
1º Lugar: R$ 5.000,00
2º Lugar: R$ 2.000,00
3º Lugar: R$ 1.000,00
Todos: Certificado com horas de participação.
Polêmica: Na maioria das empresas Data Scientists e ML Engineers não passam de profissionais de luxo
Existe um claro "descasamento" entre as expectativas dos profissionais de dados e o que a maioria das empresas realmente precisa. Partindo dessa constatação, Adren Biarnes (ML Engineer no Dailymotion) publicou seu mais recente e polêmico artigo.
No post ele levanta alguns pontos muito importantes de reflexão, como por exemplo onde estão as maiores necessidades por dados das empresas (inclusive ele apresenta uma pirâmide das necessidades) e na outra ponta apresenta o que a maioria dos profissionais de ML realmente desejam fazer no dia a dia, nesse ponto fica bem claro esse descompasso entre necessidades e desejo dos profissionais.
Diante disso, ele apresenta os principais pontos que os Data Scientists devem ficar atentos ao buscar por novas oportunidades de trabalho e assim aumentar as chances de terem as expectativas atendidas nessa busca. (em inglês)
O Data Hacker Cícero de Moura deu show em seu mais recente post no blog do Data Hackers.
ele mostra um passo a passo de como criar um ambiente de Data Lakehouse dentro da AWS, utilizando o DBT + Athena.
Nesse tutorial ele explica os conceitos por trás de cada uma das ferramentas apresentadas e mostra como é possível ter mais eficiência e organização nos processos de transformação de dados, testes, documentação e construção de Data Warehouses.
Por fim é apresentado um passo a passo, utilizando uma base de dados real disponível na internet para que você consiga aprender tudo com a "mão na massa". (em português)
Uma estratégia simples que pode mitigar riscos dos modelos em produção sem impactar negativamente usuários reais ao longo do caminho. (em Português)
Veja como a equipe de dados do Ministério da Economia encarou o desafio de expandir o time de engenharia de dados e as DAGs do Airflow. (em Português)
Será que todo o buzz em torno do Github Copilot vai mesmo fazer sentido? Nesse post Simona Winnekes conseguiu acesso a ferramenta e mostrou com detalhes como ela funciona na prática.
Spoiler: Parece que essa ferramenta ainda não vai roubar seu emprego. (em Inglês)
A ideia é simples e genial, um Notebook (compatível com o Jupyter) rodando na nuvem e com a possibilidade de colaboração em tempo real. (em Inglês)
Se você se sente despreparado para os desafios e testes envolvendo técnicas de Machine Learning em entrevistas de emprego não deixe de dar uma olhada nesse livro. É um livro totalmente gratuito e disponibilizado online, com dicas e exercícios práticos que vão te ajudar a se preparar melhor para essas entrevistas. (em Inglês)
VAGAS DA SEMANA
Experiência em Computer Vision ou Machine Learning (ou Doutorado ou Mestrado concluído com pesquisa em área relacionada à Computer Vision);
Experiência no desenvolvimento e otimização de modelos de Machine Learning;
Experiência com bibliotecas como OpenCV, SKlearn, PyTorch e frameworks como TensorFlow e Keras;
Configuração de ambientes Cloud para Big Data (EMR, Lambda, Glue, Athena, Step Functions e SageMaker);
Programação em Java e/ou Python e/ou Scala;
Conhecimento em Orquestradores de dados (Airflow, Luigi, Astronomer, Argo, Step Functions, Kube Flow);
Conhecimentos de Docker e Kubernetes;
Automação de Infraestrutura com Terraform;
O site "Visual Capitalist" nunca fez tanto jus à seu próprio nome. Nesse artigo repleto de visualizações de dados incríveis eles decidiram comparar o valor de mercado de gigantes de tecnologia como Amazon, Microsoft, Apple e Facebook com o PIB anual de diversos países do globo. A comparação é surpreendente e chega a causar muita reflexão sobre o tamanho e valor de mercado dessas empresas. (em inglês)
29 de Julho - Evento Gratuito e 100% Online
26 de Julho a 04 de Agosto - Evento Gratuito e 100% Online
28 a 30 de Setembro - Evento Gratuito e 100% Online