- Data Hackers Newsletter
- Posts
- +50 referências GRATUITAS em Data Eng. e ML! 📚
+50 referências GRATUITAS em Data Eng. e ML! 📚
Dica de um monte de podcasts sobre Data Science e Machine Learning
Fala, Data Hackers! Espero que esteja tudo bem com vocês!O principal papel do Data Hackers é trazer conteúdo livre, em português, gratuito, para a comunidade brasileira ficar cada vez mais madura em Data Science & Data Engineering.Essa news a gente compilou um MONTE de referencias, partindo do post de destaque, com mais de 50 posts, artigos e papers, passando pela lista de podcasts em inglês e português que compilaram do nosso Slack e um programa de voluntários que VOCÊ pode aprender dados e contribuir pra uma realidade da saúde no Brasil mais transparente!E mais: os melhores podcasts de data, combinando dbt com airflow, vagas sensacionais, live especial sobre Airflow e um estudo muito relevante de voluntários brasileiros sobre violência contra a mulher na pandemia.Muito conteúdo pra você espairecer um pouco nesse momento tão difícil. Conte conosco e #fiqueemcasa!
Galera, uma das coisas incríveis que a Internet traz é incentivar a colaboração na produção e curadoria de conteúdo. Lá de Berlim, o Abhishek Choudary, Lead Data Engineer na Bayer, fez um github INCRÍVEL compilando mais de 50 REFERÊNCIAS GRATUITAS de conteúdo para estudo em Engenharia de Dados e Machine Learning.Desde posts ultra valiosos, até uma lista de papers das ferramentas mais tops de mercado, de Snowflake, Apache Beam e Azure Data Lake Storage. Imperdível! (em Inglês)
Criar features e saber processar elas corretamente é um passo essencial pra criar bons modelos de Machine Learning. Nesse post no nosso blog, o Iury Rosal dá um overview completo de como tratar dados categóricos e transformálos em características numéricas, de forma que seus modelos fiquem mais supimpas possíveis! (em Português)
Seguindo a pegada de referências, trouxemos o post do mestre Flávio Clésio, que compilou vários podcasts, em português e inglês, comentados pela comunidade lá no nosso chat do Slack. Data Hackers é o melhor, claro! rsrs Mas tem um moooonte de outros aí que recomendamos e está nessa lista incrível do Flávio. (em Português e Inglês)
Ter um ambiente reprodutível de maneira fácil é um dos catalisadores da entrega de Engenharia e Ciência de Dados em larga-escala nas organizações. Neste post, o Carlos Alberto Cardoso faz um passo a passo de como criar um ambiente dev local, modularizado e replicável usando o AWS CDK, Docker e o VSCode, ferramentas muito presentes no dia-a-dia dos pros em dados. (em Inglês)
Esses 2 queridinhos dos engenheiros de dados já são efetivos separados, imagina juntos? É isso que trata o post da Astronomer, solução SaaS de Airflow. Usando Airflow e dbt, você vai poder ter não só a linhagem de suas transformações em cima do DW, mas também em todo fluxo de engenharia. (em Inglês)
Manter os clientes comprando em seus Marketplaces é o que Magalu, B2W e Amazon querem quando investem milhões em Machine Learning. Esse é o assunto que o Matheus da Rocha trouxe em nosso blog. Com uma técnica simples e elegante, que usa até a famosa Trigonometria do nosso ensino médio, Matheus traz uma das soluções mais buscadas em negócios de e-commerce hoje em dia! (Em Português)
VAGAS DA SEMANA
Proficiência em Python e desenvolvimento
Proficiência em SQL
Conhecimento intermediário em Docker/Kubernetes
Experiência cloud, (Google Cloud ou AWS)
Diferenciais: Airflow, BigQuery e Beam
+3 anos de xp em Desenvolvimento de Software
Experiência com Java, C++, ou C#.
Conhecimento avançado em Algoritmos e Estruturas de Dados
Experiência prática com bancos transacionais e NoSQL
Depois das edições de Nifi e Metabase, nosso amigo e mestre Rodrigo Teoria, juntou uma galera fera em Engenharia de Dados pra trazer um conteúdo de ponta nessa ferramenta que já é a queridinha dos Data Engineers: o Apache Airflow!Fique de olho no próximo "Supletivo DH", evento que já está formando os futuros engenheiros de dados do Brasil! Também vão palestrar outros mestres do canal #data-engineering: Eduardo Bizarro, Vitor Carra, Amom Mendes e Diego Lopes.Evento gratuito online: 31 de Março (Terça-Feira) as 20:00. Não perca!
Ué, rapaz... Não entendi foi é nada! É melhor manter na Astrologia mesmo...Dica do Igor Fernandes no Slack do Data Hackers
Estudo sobre a Violência contra a Mulher no cenário da PandemiaO projeto HealthLake, iniciativa voluntária e aberta para construir um Data Lake da saúde brasileira, fez um post ultra bacana mostrando o resultado de uma pesquisa com resultados relevantes, mas assustadores: Como a pandemia tem contribuído para o aumento dos casos de violência contra as mulheres. No link acima, você pode ver os cards produzido pelo time de voluntários, com as visualizações detalhadas do cenário, e também o artigo completo sobre a análise feita com dados públicos. (Em Português)Para saber mais sobre esse projeto incrível, acesse healthlake.com.br
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
12 e 13 de Maio - Evento Gratuito e 100% Online
30 de Março a 01 de Abril de 2021 - Evento Pago e 100% Online
17 a 19 de Agosto de 2021 - Evento Pago e 100% Online