- Data Hackers Newsletter
- Posts
- Pare de cometer esses cinco erros com Pandas 🐼
Pare de cometer esses cinco erros com Pandas 🐼
O cara que analisou 3,5 anos de namoro em mensagens do Whatsapp
Fala, Data Hackers! Seja muito bem-vindo a mais uma newsletter! Na edição dessa semana nós iremos falar sobre cinco erros que você deve evitar cometer com o Pandas; conhecerá a empresa que tem mais de 3 bilhões de fotos de redes sociais que eram usadas para reconhecimento facial pelo FBI, Walmart e Best Buy; além de conhecer a história do cara que analisou mais de três anos em mensagens do Whatsapp com a namorada. Vamos lá?
Pandas é uma das bibliotecas mais utilizadas por Data Scientists no Python, mas será que estamos usando ela da maneira mais adequada? O pessoal da Towards Data Science trouxe esse post mostrando cinco erros que cometemos no Pandão, e como podemos corrigi-los. Tem dicas que vão desde a melhor forma de lidar com tipos de dados até como usar a integração nativa com Matplotlib. (em Inglês)
O FBI, a alfândega americana e empresas como Walmart e Best Buy são apenas alguns dos 2 mil clientes da Clearview AI, empresa americana que possui um banco de dados de mais de 3 bilhões de imagens coletados de redes sociais. Facebook, Twitter e Youtube ficaram pistola com a situação, enviando cartas de cessação e desistência (a.k.a "Para com isso ou te mando o processinho"). O Olhar Digital explicou mais o caso. (em Português)
Chris Brownlie descobriu que é possível exportar as mensagens do Whatsapp em um arquivo de texto, e teve a ideia de analisar as conversas entre ele e a namorada em seus mais de três anos de namoro. O resultado foi uma análise bem interessante que mostra não só a quantidade de mensagens ao longo do tempo, mas até os emojis e palavras mais utilizados pelos dois. (em Inglês)
Joseph Redmon, criador de uma das maiores e mais conhecidas bibliotecas de Computer Vision do mundo, o YOLO (You Only Look Once) disse que irá parar qualquer pesquisa em CV. O motivo principal é sua preocupação ética sobre como seu trabalho está sendo utilizado, em especial em situações de vigilância, reconhecimento facial e privacidade. Pelo Twitter,
I stopped doing CV research because I saw the impact my work was having. I loved the work but the military applications and privacy concerns eventually became impossible to ignore.
— Joseph Redmon (@pjreddie)
4:09 PM • Feb 20, 2020
. (em Inglês)
Lizzie O’Leary conduz o podcast "What Next", onde traz as principais notícias e discussões em tecnologia. Em um episódio recente, ela entrevistou
, Senior A.I. reporter da MIT Tech Review, onde ela conta como a OpenAI foi de uma organização com proposta filantrópica a uma empresa que está visando o lucro. (em Inglês)
O Data Hacker
criou uma série de cinco artigos incríveis falando sobre técnicas de previsão de séries temporais. A série visa mostrar as diferentes abordagens para resolver esse tipo de problema, que vai de modelos autoregressivos (ARIMA) a algoritmos de Machine Learning. E o melhor: com o código liberado para usarmos. (em Português)
VAGAS DA SEMANA
SQL e NoSQL
Hadoop, Spark
ETL
Cloud (AWS, Azure)
SQL
Python
Linux
Docker
Lidando com a Sindrome do Impostor - Lex FridmanSemana passada o Allan Sene trouxe um episódio do podcast do Lex Fridman, e hoje eu quero trazer mais um desse cara de quem sou muito fã. Durante uma sessão de Ask Me Anything (Pergunte-me qualquer coisa, em tradução livre), Lex trouxe algumas dicas e conselhos sobre como lidar com a Síndrome do Impostor. (em Inglês)
Qual o consumo de proteína no Brasil e no mundo?O pessoal do Nexo Jornal fez uma análise bem legal mostrando o consumo de proteína no Brasil e no mundo inteiro. Dentre as visualizações, é interessante ver que embora o Brasil seja um dos maiores consumidores de carne bovina, outros países consomem mais proteína animal que nós, considerando o PIB per capita. (em Português)
PRÓXIMOS EVENTOS E MEETUPS
O nosso Community Manager Marlesson Santana estará lá
14 de Março
Goiania/GO - Gratuito
21 e 22 de Março
Belo Horizonte/MG - R$ 1200