+50 referências GRATUITAS em Data Eng. e ML! 📚

Dica de um monte de podcasts sobre Data Science e Machine Learning

Fala, Data Hackers! Espero que esteja tudo bem com vocês!O principal papel do Data Hackers é trazer conteúdo livre, em português, gratuito, para a comunidade brasileira ficar cada vez mais madura em Data Science & Data Engineering.Essa news a gente compilou um MONTE de referencias, partindo do post de destaque, com mais de 50 posts, artigos e papers, passando pela lista de podcasts em inglês e português que compilaram do nosso Slack e um programa de voluntários que VOCÊ pode aprender dados e contribuir pra uma realidade da saúde no Brasil mais transparente!E mais: os melhores podcasts de data, combinando dbt com airflow, vagas sensacionais, live especial sobre Airflow e um estudo muito relevante de voluntários brasileiros sobre violência contra a mulher na pandemia.Muito conteúdo pra você espairecer um pouco nesse momento tão difícil. Conte conosco e #fiqueemcasa!

Galera, uma das coisas incríveis que a Internet traz é incentivar a colaboração na produção e curadoria de conteúdo. Lá de Berlim, o Abhishek Choudary, Lead Data Engineer na Bayer, fez um github INCRÍVEL compilando mais de 50 REFERÊNCIAS GRATUITAS de conteúdo para estudo em Engenharia de Dados e Machine Learning.Desde posts ultra valiosos, até uma lista de papers das ferramentas mais tops de mercado, de Snowflake, Apache Beam e Azure Data Lake Storage. Imperdível! (em Inglês)

Criar features e saber processar elas corretamente é um passo essencial pra criar bons modelos de Machine Learning. Nesse post no nosso blog, o Iury Rosal dá um overview completo de como tratar dados categóricos e transformálos em características numéricas, de forma que seus modelos fiquem mais supimpas possíveis! (em Português)

 

Seguindo a pegada de referências, trouxemos o post do mestre Flávio Clésio, que compilou vários podcasts, em português e inglês, comentados pela comunidade lá no nosso chat do Slack. Data Hackers é o melhor, claro! rsrs Mas tem um moooonte de outros aí que recomendamos e está nessa lista incrível do Flávio. (em Português e Inglês)

Ter um ambiente reprodutível de maneira fácil é um dos catalisadores da entrega de Engenharia e Ciência de Dados em larga-escala nas organizações. Neste post, o Carlos Alberto Cardoso faz um passo a passo de como criar um ambiente dev local, modularizado e replicável usando o AWS CDK, Docker e o VSCode, ferramentas muito presentes no dia-a-dia dos pros em dados. (em Inglês)

Esses 2 queridinhos dos engenheiros de dados já são efetivos separados, imagina juntos? É isso que trata o post da Astronomer, solução SaaS de Airflow. Usando Airflow e dbt, você vai poder ter não só a linhagem de suas transformações em cima do DW, mas também em todo fluxo de engenharia. (em Inglês)

Manter os clientes comprando em seus Marketplaces é o que Magalu, B2W e Amazon querem quando investem milhões em Machine Learning. Esse é o assunto que o Matheus da Rocha trouxe em nosso blog. Com uma técnica simples e elegante, que usa até a famosa Trigonometria do nosso ensino médio, Matheus traz uma das soluções mais buscadas em negócios de e-commerce hoje em dia! (Em Português)

VAGAS DA SEMANA

  • Proficiência em Python e desenvolvimento

  • Proficiência em SQL

  • Conhecimento intermediário em Docker/Kubernetes

  • Experiência cloud, (Google Cloud ou AWS)

  • Diferenciais: Airflow, BigQuery e Beam

  • +3 anos de xp em Desenvolvimento de Software

  • Experiência com Java, C++, ou C#.

  • Conhecimento avançado em Algoritmos e Estruturas de Dados

  • Experiência prática com bancos transacionais e NoSQL

Depois das edições de Nifi e Metabase, nosso amigo e mestre Rodrigo Teoria, juntou uma galera fera em Engenharia de Dados pra trazer um conteúdo de ponta nessa ferramenta que já é a queridinha dos Data Engineers: o Apache Airflow!Fique de olho no próximo "Supletivo DH", evento que já está formando os futuros engenheiros de dados do Brasil! Também vão palestrar outros mestres do canal #data-engineering: Eduardo Bizarro, Vitor Carra, Amom Mendes e Diego Lopes.Evento gratuito online: 31 de Março (Terça-Feira) as 20:00. Não perca!

Ué, rapaz... Não entendi foi é nada! É melhor manter na Astrologia mesmo...Dica do Igor Fernandes no Slack do Data Hackers

Estudo sobre a Violência contra a Mulher no cenário da PandemiaO projeto HealthLake, iniciativa voluntária e aberta para construir um Data Lake da saúde brasileira, fez um post ultra bacana mostrando o resultado de uma pesquisa com resultados relevantes, mas assustadores: Como a pandemia tem contribuído para o aumento dos casos de violência contra as mulheres. No link acima, você pode ver os cards produzido pelo time de voluntários, com as visualizações detalhadas do cenário, e também o artigo completo sobre a análise feita com dados públicos. (Em Português)Para saber mais sobre esse projeto incrível, acesse healthlake.com.br

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

12 e 13 de Maio -  Evento Gratuito e 100% Online

30 de Março a 01 de Abril de 2021 -  Evento Pago e 100% Online

17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online