Correlação nunca é a resposta, independente da pergunta 💥

Um projeto ponta a ponta usando Airflow, Redshift e Metabase

Fala, Data Hacker. Seja muito bem-vindo a mais uma newsletter! Essa edição está bem diversa, onde falamos desde política até visualização de dados. Esperamos que você esteja bem e seguro nessa quarentana, mas, caso esteja entediado, separamos 10 projetinhos em Python para você brincar nas próximas semanas. Isso e muito mais na nossa newsletter de hoje. Vamos lá?

Não mate o mensageiro galera, não fui eu quem disse isso. O escritor Allen Downey, criador de excelentes livros como "Pense em Python", compartilhou sua opinião sobre o uso de estatísticas como Correlação de Pearson, além de sugerir alternativas para seus principais usos, como saber o quão "preditível" uma variável é ou medir o tamanho do efeito. Mesmo que você não concorde, sempre vale a pena ler diferentes opiniões, não é? (em Inglês)

Vou te dizer: acho que esse é um dos posts mais legais que vi ultimamente. O Data Hacker

fez um trabalho sensacional ao criar esse tutorial onde você poderá usar Airflow, Docker, Redshift e Metabase para criar uma solução ponta a ponta para coletar dados abertos e visualizá-los em dashboards. 

Estava procurando um conteúdo brazuca para adicionar no portfólio e/ou estudos? Achou, meu filho! (em Português)

 

Você já sabe o quão insistente eu sou com a questão de criarmos um portfólio, e essa semana eu esbarrei nesse post que achei bem legal. Ele dá dicas de aplicações que você pode criar utilizando nada além de Python.

Tem de calculadora a assistentes virtuais; de Jogo da Velha a player de música como Spotify, tudo isso acompanhado de algumas bibliotecas muito úteis que você pode usar durante o projeto. (em Inglês)

Uma das principais regras que o pessoal do Google prega é: "

", mesmo que muitas pessoas pensem o contrário.

A verdade é que poucos conhecem e dão valor ao primo mais feio do ML: o motor de regras

, que nada mais é que a aplicação de algumas regras (juntamente com aqueles lindos 

if-else

) que cubram cenários mais previsíveis.

Quer um exemplo? Que tal antes de lançar um sistema de recomendação de filmes, você simplesmente mostra os Top 10? Nesse post, você irá conhecer um pouco mais sobre esses motores e como aplicamos juntamente com (ou antes de) Machine Learning. (em Inglês)

Nesse post muito prático, o Data Hacker

, reune

dicas úteis de como você pode começar a criar visualizações mais cativantes

e eficientes. Aqui ele reune dicas que vão desde quais fontes utilizar nos seus gráficos até uma refatoração completa de uma visualização pouco informativa. E, aproveitando,

sempre se lembre que acessibilidade é crucial para uma boa visualização

, e a Data Hacker

dá uma verdadeira aula sobre

. (em Português)

Quando Robert Yi trabalhava no Airbnb, ele tinha acesso a uma incrível ferramenta para saber o que a coluna de um banco de dados significava; onde ele acha uma determinada informação; ou como a métrica X é computada: o 

. O problema, segundo Robert, é que

ele descobriu que muitos de seus amigos não tinham acesso a uma ferramenta tão poderosa

.

Pensando nisso, ele criou o

: um CLI onde você pode começar a catalogar as tabelas de seu Data Warehouse e começar a compartilhar com seu time onde as informações estão e o que significam.

. (em Inglês)

VAGAS DA SEMANA

  • Ensino superior completo;

  • Expertise em Python e R;

  • EXP em Experimentação (A/B testing, Causal Inference);

  • EXP em gestão de pessoas;

  • Forte background em Estatísticas e Machine Learning

  • Excel avançado;

  • Perfil analítico;

  • Boa comunicação;

  • Resolução de problemas

Antifrágil: coisas que se beneficiam do caosA dica dessa semana é de um clássico que estou lendo atualmente. Nesse livro, Nassim Taleb (figura polêmica e amante da incerteza) mostra como não devemos temer a aleatoriedade. Na verdade, ele mostra o quão ela é necessária e como podemos nos beneficiar, nos tornando mais fortes às incertezas da vida.É um livro denso, em que levo um tempo para absorver alguns conceitos, mas estou curtindo demais essa visão inédita sobre algo que geralmente nos ensinam a temer: o caos.  (em Português).

Meme enviado pelo Data Hacker Armando Barbosa no nosso Slack

Quem irá vencer as eleições americanasA galera do FiveThirtyEight é famosa nos períodos eleitorais americanos por fazerem previsões acuradas sobre o possível vencedor e sobre os cenários que irão se desenrolar nos próximos dias, e dessa vez não foi diferente. Nessa visualização, eles mostram como está o favorecimento dos candidatos nos diferentes estados americanos, e quem deverá vencer as eleições que irão rolar na primeira semana de Novembro. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

22 a 29 de outubro de 2020 - Até R$ 8.000,00 em prêmios

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito