2 Anos de Podcast Data Hackers: pra matar o buzz! 😎

Como o Airbnb usa Deep Learning para melhorar suas buscas

Fala, Data Hackers! Estamos fazendo 2 Anos de Podcast para essa comunidade linda, o maior do Brasil quando o papo é DADOS! Não é incrível?!Pra comemorar, como era de se esperar, resolvemos fazer um episódio especial, bem descontraído e engraçado: o UFB - Ultimate Fighter Buzzword!Tirado da Wikipedia, a definição da Buzzword:"Um chavão é uma palavra ou frase, nova ou já existente, que se torna muito popular por um período de tempo. Os chavões frequentemente derivam de termos técnicos, mas muitas vezes têm muito do significado técnico original removido pelo uso da moda, sendo simplesmente usados ​​para impressionar outras pessoas."E como impressiona! Pra acabar com todo esse lero-lero, nos juntamos a Mario Filho, Marlesson Santana, Pietro Oliveira, nossos community managers pra gravar O EPISÓDIO DE PODCAST SOBRE DADOS MAIS DIVERTIDO ATÉ HOJE! No episódio, fizemos uma batalha das buzzwords mais chatas do mercado, até que escolhemos uma vencedora!Lembrando que, claro, tudo foi discutido com todo o ar descontraído nosso, sem querer ofender ninguém, né pessoal. Em avançado, como disse o Paulo no episódio: Desculpe qualquer coisa! 😅E mais: como usar AWS EMR e Step Functions pra big data, Deep Learning para Buscas no Airbnb, Livro referencia mundial para aprender NoSQL.

Será que tem uma área com mais buzzwords que a área de dados, ou melhor, DATA (Deita, como diz Mario Filho)?! Se tiver, eu não quero nem saber!O fato é que juntamos os "piores" especialistas desse "Brazil" pra elegerem a CAMPEÃ das buzzwords! No Ultimate Fighter Buzzword, entram todas elas: Big Data, Cognitivo, AI (ei-ai), Storytelling e outras, mas sai só uma. Quem será que ganhou essa disputa?Lembrando que: "Não acho que quem ganhar ou quem perder, nem quem ganhar nem perder, vai ganhar ou perder. Vai todo mundo perder."Você pode acompanhar também pelo Spotify, Google Podcast, Itunes ou no seu agregador favorito! (em Português)

Utilização de Deep Learning nas mais variadas situações tem sido comum no mundo dos dados, da tradicional visão computacional até sistemas de recomendação.

Esse case muito bacana do Airbnb, mostra como eles usaram DL para melhorar o rankeamento das buscas no seu site. Aumentando a diversidade nos resultados e utilizando contexto das queries feitas pelos usuários nas redes, os resultados chegaram a ser 0,7% e 0,4% melhores nos bookings. Incrível! (em Inglês)

 

Cada vez mais frameworks legais surgem para fazer o trabalho de Ciência de Dados mais bonito e interativo. É essencial entender bem dessas ferramentas pra escolher a que mais vai te atender em cada entrega que você faz no seu trabalho.

Esse post do, Markus Schmitt, fundador do Data Revenue, faz um comparativo com cada uma das ferramentas que mais bombam nas mão de Cientistas e Analistas de Dados feras no Python - e também R, para alguns deles. (em Inglês)

Já está sendo mais comum utilizar orquestradores de jobs que usam código, ao invés das tradicionais ferramentas visuais de drag'n'drop. Esse guia completo do blog da AWS mostra como combinar o Step Functions, serviço intuitivo, barato e escalável pra máquinas de estados com o EMR - Elastic MapReduce - que é onde se roda Spark, Hadoop e outras ferramentas de big data na cloud da Amazon. Veja! (em Inglês)

Se você trabalha com governança de dados ou está em um projeto de self-service analytics e nunca ouviu falar do Amundsen, tá na hora de conhecê-lo! Essa ferramenta open-source criada pelos engenheiros da Lyft, vem sendo uma ótima alternativa para quem precisa democratizar os dados nas organizações. Nesse post, Tao Feng da Lyft, conta um resumo desde a criação, até a entrada do projeto para a Linux Foundation. Também falam sobre os próximos passos do projeto, que estamos ansiosos por ver! (em Inglês)

Coleta de dados não é um problema simples, ainda mais com cada vez mais sistemas SaaS e outras fontes de dados cada vez mais comuns nas organizações. Pra enfrentar soluções pagas como Fivetran, StitchData, já havia o Singer. Mas agora surgiu uma nova alternativa, o Airbyte. Nesse post, o pessoal que mantem o projeto dá um overview do porque criaram um projeto novo e como eles se diferenciam do Singer. (em Inglês)

VAGAS DA SEMANA

  • XP em gestão de times, visão estratégica de produto

  • Fortes habilidades analíticas e de storytelling;

  • Experiência em gestão de projetos ágeis;

  • Habilidades de liderança;

  • Experiência com análise de experimentos;

  • Experiência com digital analytics (Google Analytics, Firebase, ou outros);

  • Experiência em trabalhar junto com área de marketing ou produto;

  • Experiência com funil de conversão e ferramenta de viz

  • Conhecimento em SQL, Estatística 

NoSQL Essencial: um Guia Conciso Para o Mundo Emergente da Persistência PoliglotaDominar tecnologias de bancos NoSQL é um requisito primordial para qualquer Data Engineer e também para outros perfis, como analistas e cientistas de dados. Esse livro é escrito por um dos mitos em software do mundo, Martin Fowler, em co-autoria com Pramod Sadalage. É uma das bíblias no assunto, recomendada em vários cursos de Bancos de Dados Avançados no país e fora. Recomendamos! (em português).

Para de ficar fazendo essas gambiarras pro Excel do Marketing aguentar essas 50 mil linhas!

Evolução do PIB dos países sulamericanos desde 1962O Pie Chart Pirate é um daqueles canais que você descobre caindo no buraco negro do YouTube, depois de passar 2 horas vendo todos seus videos. Nesse post que ele fez no Reddit /r/Dataisbeautiful, ele traz um pie chart que acompanha o crescimento das economias da América do Sul, de 1962 até 2019. É uma pena que esse crescimento punjante dos anos 2010, estão sendo freiados nesses anos. Pra ver mais, sigam PCP no Youtube!  (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

19 a 24 de outubro de 2020

22 a 29 de outubro de 2020 - Até R$ 8.000,00 em prêmios

7 a 22 de Outubro de 2020

19 a 22 de Outubro de 2020 - Evento online gratuito

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito