Ensinando uma AI a jogar Super Mario 🎮

O que ninguém te conta sobre métricas de classificação binária

Fala, Data Hacker. Seja bem-vindo de volta a mais uma newsletter! O assunto principal de hoje pode ser o próximo projeto do seu portfólio, graças a um tutorial incrível que o pessoal da Paperspace trouxe pra gente. Além disso, hoje vamos te mostrar com deployar Airflow na AWS; além de coisas que ninguém te conta sobre métricas de modelos. Sem mais delongar, vamos lá!

Há alguns anos atrás, eu mesmo já escrevi um post explicando os conceitos básicos de Reinforcement Learning usando Super Mario ao invés de Matemática. Mas, o pessoal da Paperspace levou esse assunto a um novo nível ao lançar esse tutorial ensinando como você pode treinar seu próprio modelo usando PyTorch. Vale muito a pena conferir! (em Inglês)

Existem conteúdos sobre métricas de Machine Learning aos montes na Internet, mas, além de saber para que servem, você sabe para o que elas NÃO servem? É isso e muito mais que o Data Hacker

 traz nesse completo post. (em Português)

 

Você conhece alguém que está doido pra se tornar um Engenheiro de Dados, mas ele ou ela não sabe por onde começar? Que tal um roadmap bem visual pra seguir e ir, pouco a pouco, galgando os passos até o se tornar um Jedi Data Engineer? Nosso co-fundador Allan Sene fez esse roadmap lindo e fácil de se seguir com vários assuntos para você estudar sobre Engenharia de Dados! (em Português)

O Amazon Lake Formation é uma solução da AWS para juntar várias ferramentas em único lugar para facilitar a criação de Data Lakes. Nesse post, o Data Hacker

traz sua opinião sobre a ferramenta, destacando o que ela faz bem, e o que não é tão bom assim. (em Português)

Seaborn é uma biblioteca velha guarda quando falamos de data visualization em Python, sendo uma boa alternativa ao clássico Matplotlib (embora o Seaborn use o Matplotlib por debaixo dos panos). Nesse post, você vai conhecer as novidades que fizeram na sua nova versão. (em Inglês)

Apache Airflow é o queridinho dos Data Scientists quando falamos de criação de orquestração de código e ETL. Mas, se você quer usar o Airflow, é melhor fazê-lo da melhor forma. Nesse post do Data Hacker

, ele ensina quais as melhores práticas que você deve se preocupar ao começar a utilizá-lo. (em Inglês)

VAGAS DA SEMANA

  • Inglês e Português/Espanhol fluente

  • 10 anos de exp. na área de dados

  • Exp. em liderança de times

  • Grande entendimento em Estatistica, DataScience, SQL e modelagem

  • Formação em Computação ou relatadas

  • Proeficiência em SQL

  • Exp. em Data Lakes e DWs

  • Conhecimento em Python, Scala, Spark, Flink ou Airflow é diferencial

A Alura realizou na última semana a Imersão Carreira Tech, com lives sobre diversas carreiras em tecnologia. Uma dessas lives foi sobre carreira em dados, com convidados ilustres como Camila Laranjeira, Flavio Clesio e Fernanda Wanderley. Vale muito a pena conferir! (em Português)

Dica do Data Hacker

Rodrigo Teoria

, no 

Criando melhores histórias e visualizaçõesMesmo não sendo necessariamente uma visualização, esse post do pessoal do The Pudding merece estar aqui. Eles estão fazendo uma série de artigos que ensinam como podemos criar melhores histórias e visualizações mais cativantes. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

Online e gratuito

15 a 17 de setembro de 2020 às 19h

Online e gratuito

22 de setembro de 2020 - 15:30 até 16:30

Online e gratuito

06 a 16 de outubro de 2020

Online e gratuito

30 de Novembro a 18 de Dezembro de 2020