Como o Facebook democratiza sua imensidão de dados? 😨

Usando Prophet do Facebook para previsão em séries temporais

Fala, Data Hacker! Prontos para uma dose semanal de conhecimentos sobre dados?!Nessa news trazemos um case muito legal de Data Discovery: o Nemo, sistema desenvolvido internamente pelo Facebook para facilitar o acesso aos milhares de datasets em suas bases. Como era de se esperar, o Facebook utiliza-se de diversas ferramentas e libs construídas internamente, como o Unicorn - seu motor de busca em grafos ultra-potente - e modelos treinados no FBLearner, backbone de toda a IA e ML feita no Facebook.E mais: aprenda de maneira fácil sistemas de recomendação e time series em Python, as melhores vagas do país e uma competição de data science que tá bombando por aqui! Bora?!

Seguindo os cases conhecidos de Airbnb, Lyft, Uber e Linkedin, o Facebook decidiu abrir para o público como eles construíram sua própria ferramenta de Data Discovery, o Nemo.Com features como personalização e NLP, o sistema consegue retornar datasets relevantes para perguntas como "Quantos usuários ativos semanalmente existem no Instagram?". Incrível hein?!Porém como utiliza-se de muita coisa desenvolvida internamente, como o Unicorn, sistema de busca em grafos ultra-performático do FB, não devemos ver o Nemo como open-source :/ (em Inglês)

Lançado em 2017 pelo Facebook, a biblioteca Python chamada Prophet botou na mão dos meros mortais uma forma muito fácil de construir modelos preditores em séries temporais. 

Nesse tutorial pro nosso blog, a Data Hacker Carol Braga dá um breve overview de como se construir um modelo para prever a produção de leite de uma fazenda. (em Português)

 

Sistemas de recomendação permeam nossa vida já: dos anúncios nas redes sociais a sua próxima música "aleatória" no Spotify. Apesar da teoria estar cada vez mais avançada, o uso de RecSys não fica mais restrito a grandes empresas e pesquisadores de phd em universidades de renome.

O Data Hacker Gustavo Santos registrou seus passos de aprendizagem usando um kernel no Kaggle muito bacana do

no nosso blog. Confira! (em Português)

Tá rolando uma competição bem bacana promovida pelo Mercado Livre. O desafio consiste em prever a próxima compra de um usuário, levando em conta o histórico de navegação. Os 3 primeiros lugares vão levar uma

NVIDIA GEFORCE RTX 3080!

 Tem uma galera do Data Hackers, incluindo os mestres Mario Filho e Marlesson Santana competindo. Aproveitem pra bater um papo com eles no Slack sobre o desafio! (em Português)

Um problema que ficou evidente nessa pandemia é o quanto os sistemas de comunicação são pouco inclusivos. Pensando nisso, pesquisadores da Google desenvolveram um modelo que reconhece quando uma pessoa está fazendo linguagem de sinais, dessa forma, podem colocá-las no foco das video-conferência. Show demais! (em Inglês)

Grafos é uma das estruturas de dados mais poderosas da ciência da computação. Seu uso estende-se a modelagens logísticas, de redes sociais e muitas outras mais. Nessa aula muito bacana, o Data Hacker Celso Souza mostra como se utilizar grafos e machine learning para obter resultados em diversos problemas do mundo real, incluindo na área de Marketing. (Em Português)

VAGAS DA SEMANA

  • Ferramentas de data viz (e.g. Power BI, Tableau, Looker)

  • Conhecimentos de SQL

  • Capacidade de estruturar problemas de negócio ambíguos em soluções data-driven

  • Sólidos conhecimentos de estatística

  • Boas noções de Cloud Computing (AWS e/ou GCP);

  • Conhecimento nas linguagens programação Python, Scala, NodeJS ou Java;

  • Experiência com Modelo relacional e não relacional com Postgres, MySQL e MongoDB

  • Vivência com processamento distribuído;

  • Experiência na criação de pipeline de ingestão 

Assim dá pra entender como que o Biden deu aquela virada: tava ganhando, mesmo perdendo! :v

A variação das temperaturas conforme latitudes no mundoCom uma combinação simples entre um mapa, uma linha e o tempo, o analista Neil Kaye fez essa linda visualização mostrando a variação da temperatura no mundo, de acordo com a linha que passa latitude a latitude. Observem como a temperatura no Himalaia, indepedente de estar próximo a zona tropical, são menores que zero. Muito legal! (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

01, 02, 03 e 04 de Dezembro de 2020 - Online Gratuito

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito