- Data Hackers Newsletter
- Posts
- Uma semana bem mão na massa em dados! 👏
Uma semana bem mão na massa em dados! 👏
Fazendo um bot inteligente com ML para monitorar investimentos
Fala, Data Hacker! Nessa quarentena, nada melhor do que arrumar coisas relevantes pra ocupar a cabeça, não é mesmo? Pra desbancar as lives sertanejas, a news dessa semana vai te trazer um monte de tutorial, guias e projetos pra você desenvolver aí no conforto da sua casa e aprender mais sobre Ciência, Engenharia de Dados, Auto ML e mais!Hoje trouxemos: como criar um bot para monitorar investimentos, como fazer webscrapping de gráficos interativos em Python, várias dicas sobre Apache Airflow em produção, além de lives e eventos imperdíveis de dados, pra dar um up na sua semana!Bora conferir?
Auto-ML é um assunto que sempre estamos falando, tanto nos podcasts, quanto no nosso chat no Slack. Porém muita gente ainda não entende bem como funciona, quando usar e se vale mesmo a pena substituir o bom e velho toque humano no processo de modelagem.
O nosso parceiro Flávio Clésio, Machine Learning Engineer na My Hammer, escreveu um guia completaço sobre Auto-ML no nosso blog. Dividido em 3 partes, o Flavio passa por todos os pontos essenciais para quem quer entender de vez o que é esse hype.
Imagina você, enquanto trabalha tranquilamente, recebe uma mensagem em seu celular sobre uma compra imperdível de uma ação na Bolsa. Pois é, isso já é realidade e pode ser feito por você mesmo! Fellipe Gomes, Cientista de Dados na FGV, passa por todo o passo-a-passo de como criar um bot de ML para monitorar investimentos em tempo-real! (em Português)
É muito comum que informações hoje sejam disponibilizadas em gráficos interativos. Um bom exemplo é a busca sobre
. Em um post bem bacana pro blog do DH, Otávio Simões fez um tutorial de como coletar dados de gráficos interativos, como o do Dolar, usando Selenium e Python. Bacana demais! (em Português)
Quem usa Apache Airflow em produção já deve ter passado vários apertos para escalar a infra na hora que as jobs se acumulam. O Data Hacker, André Sionek, Data Engineer na Gousto, liberou o código de um projeto que vai facilitar nossa vida! Esse projeto contém toda configuração pra deploy de clusters auto-escaláveis do Airflow no gerenciador de containeres da AWS, o ECS. (em Português)
Seguindo na pegada do orquestrador de ETL mais famosos dos últimos meses, agora trouxemos um guia do Diego Lopes, sobre como monitorar sua plataforma utilizando o Grafana, outro open-source. Diego também disponibiliza os códigos de configuração usados em seu github. Imperdível! (em Português)
Um dos maiores desafios em Data Science é produtizar os modelos inteligentes. Nesse post incrível, Bugra Akyildiz, Senior Data Science Manager e Mestre pela NYU, resume 3 formas mais comuns de se servir os modelos, quais são os prós e contras de cada um e dicas de como aplicar cada modelo! Sensacional! (em Inglês)
VAGAS DA SEMANA
Formação nas áreas de Estatística, Matemática, Computação, Física ou correlatas
Experiência com programação em Python ou R
Experiência com modelagem de crédito e técnicas de machine learning
Conhecimento sobre o negócio de Crédito
Python ou R
Bibliotecas de visualização (matplotlib, plotly, seaborn, etc)
Bibliotecas de Estatística, Machine Learning (Ex.: scikit-learn, statsmodels, shiny, dplyr, etc)
Experiência com modelagem SQL
Experiência com Cloud (de preferência AWS)
Essa live do Data Council é imperdível! Vão trazer para falar do Amundsen, open-source amado na comunidade que faz de forma majestosa o Catálogo e Discovery de Dados, ninguém menos que Mark Grover, criador e product manager da plataforma. Inscreva-se pra não perder. Recomendamos também seguir o canal do Data Council, só evento top! (em Inglês)
Página no Instagram sobre Data VizDica do nosso querido Marlesson Santana, uma página só para visualizações e storytellings de dados no Instagram: a @storytellingcomdados. Com dicas bacanas sobre quais cuidados tomar quando for criar gráficos, posts com visualizações legais, como as que publicamos aqui semanalmente, além de uma dosezinha de humor. Siga lá! (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
17 de Junho de 2020 - 19:00
17 de Junho de 2020 - 13:00