Pare de cometer esses cinco erros com Pandas 🐼

O cara que analisou 3,5 anos de namoro em mensagens do Whatsapp

Fala, Data Hackers! Seja muito bem-vindo a mais uma newsletter! Na edição dessa semana nós iremos falar sobre cinco erros que você deve evitar cometer com o Pandas; conhecerá a empresa que tem mais de 3 bilhões de fotos de redes sociais que eram usadas para reconhecimento facial pelo FBI, Walmart e Best Buy; além de conhecer a história do cara que analisou mais de três anos em mensagens do Whatsapp com a namorada. Vamos lá?

Pandas é uma das bibliotecas mais utilizadas por Data Scientists no Python, mas será que estamos usando ela da maneira mais adequada? O pessoal da Towards Data Science trouxe esse post mostrando cinco erros que cometemos no Pandão, e como podemos corrigi-los. Tem dicas que vão desde a melhor forma de lidar com tipos de dados até como usar a integração nativa com Matplotlib. (em Inglês)

O FBI, a alfândega americana e empresas como Walmart e Best Buy são apenas alguns dos 2 mil clientes da Clearview AI, empresa americana que possui um banco de dados de mais de 3 bilhões de imagens coletados de redes sociais. Facebook, Twitter e Youtube ficaram pistola com a situação, enviando cartas de cessação e desistência (a.k.a "Para com isso ou te mando o processinho"). O Olhar Digital explicou mais o caso. (em Português)

 

Chris Brownlie descobriu que é possível exportar as mensagens do Whatsapp em um arquivo de texto, e teve a ideia de analisar as conversas entre ele e a namorada em seus mais de três anos de namoro. O resultado foi uma análise bem interessante que mostra não só a quantidade de mensagens ao longo do tempo, mas até os emojis e palavras mais utilizados pelos dois. (em Inglês)

Joseph Redmon, criador de uma das maiores e mais conhecidas bibliotecas de Computer Vision do mundo, o YOLO (You Only Look Once) disse que irá parar qualquer pesquisa em CV. O motivo principal é sua preocupação ética sobre como seu trabalho está sendo utilizado, em especial em situações de vigilância, reconhecimento facial e privacidade. Pelo Twitter,

. (em Inglês)

Lizzie O’Leary conduz o podcast "What Next", onde traz as principais notícias e discussões em tecnologia. Em um episódio recente, ela entrevistou

, Senior A.I. reporter da MIT Tech Review, onde ela conta como a OpenAI foi de uma organização com proposta filantrópica a uma empresa que está visando o lucro. (em Inglês)

O Data Hacker

criou uma série de cinco artigos incríveis falando sobre técnicas de previsão de séries temporais. A série visa mostrar as diferentes abordagens para resolver esse tipo de problema, que vai de modelos autoregressivos (ARIMA) a algoritmos de Machine Learning. E o melhor: com o código liberado para usarmos. (em Português)

VAGAS DA SEMANA

  • SQL e NoSQL

  • Hadoop, Spark

  • ETL

  • Cloud (AWS, Azure)

  • SQL

  • Python

  • Linux

  • Docker

Lidando com a Sindrome do Impostor - Lex FridmanSemana passada o Allan Sene trouxe um episódio do podcast do Lex Fridman, e hoje eu quero trazer mais um desse cara de quem sou muito fã. Durante uma sessão de Ask Me Anything (Pergunte-me qualquer coisa, em tradução livre), Lex trouxe algumas dicas e conselhos sobre como lidar com a Síndrome do Impostor. (em Inglês)

Qual o consumo de proteína no Brasil e no mundo?O pessoal do Nexo Jornal fez uma análise bem legal mostrando o consumo de proteína no Brasil e no mundo inteiro. Dentre as visualizações, é interessante ver que embora o Brasil seja um dos maiores consumidores de carne bovina, outros países consomem mais proteína animal que nós, considerando o PIB per capita. (em Português)

PRÓXIMOS EVENTOS E MEETUPS

O nosso Community Manager Marlesson Santana estará lá

14 de Março

Goiania/GO - Gratuito

21 e 22 de Março

Belo Horizonte/MG - R$ 1200