Facebook admite não saber o que faz com seus dados

A conferência da Nvidia com sessões comentadas em Português Pesquisa mostra que Github Copilot aumenta a produtividade de desenvolvedores?

Fala, Data Hackers. Bora pra mais uma semana de conteúdos! Essa semana nós trazemos o destaque dos engenheiros do Facebook admitindo na corte que não sabem o que é feito com seus dados. Além disso, nessa edição vamos falar de:

Na próxima semana, de 19 a 22 de setembro, a NVIDIA Brasil irá disponibilizar sessões com a participação em tempo real de especialistas técnicos e de mercado, em português, onde irão comentar o conteúdo das apresentações do GTC, bem como sanar possíveis dúvidas dos participantes. É a sua chance de acompanhar conteúdos incríveis em uma das maiores conferências de tecnologia do mundo na companhia de especialistas da indústria. IMPORTANTE: para participar destas sessões, é necessário inscrever-se antes no GTC (link abaixo)

Em um documento vazado recentemente, engenheiros que trabalharam no Facebook admitiram que a empresa do Markinho não sabe para onde vão os dados dos usuários da plataforma. Um dos engenheiros disse que duvida que alguém seja capaz de dizer o fluxo e o que acontece com os dados nos mais de 55 sistemas diferentes que o Facebook possui. Confira mais sobre o assunto nessa matéria da VICE. (em Inglês)

O Github realizou uma pesquisa para saber a satisfação e percepção de desenvolvedores ao utilizarem o Copilot, sua solucão que gera códigos baseado em Machine Learning. Um dos grandes resultados da pesquisa está no fato do Copilot ter aumentado entre 60% e 75% a satisfação dos usuários com seu trabalho. (em Inglês)

 

Nesse artigo de Benn Stancil, ele traz uma de suas famosas reflexões quando falamos sobre como tratamos dados como um produto. O que isso significa e, o que seria a cadeia de produção dos dados. (em Inglês)

O Leon Solo do Let's Data trouxe esse blog post muito legal que vai te ensinar a não cair nas velhas armadilhas quando trabalhamos com dados desbalanceados. Vale muito a pena conferir esse trabalho. (em Português)

O Instacart é uma das maiores foodtechs do mundo e nesse artigo eles contam como utilizaram Machine Learning pra ajudar clientes a autocompletar seus pedidos no aplicativo.

Elasticidade de preço é um problema muito interessante da indústria onde podemos utilizar machine learning para resolver. Esse artigo do Hacker Noon dá não só um contexto sobre esse tipo de problema, mas te ensina a criar suas primeiras linhas de código para começar a resolvê-lo.

Se você queria ter acesso as imagens do Stable Diffusion, mas ainda não tem acesso a ferramenta, os seus problemas acabaram. O site Lexica reune uma base gigantesca de imagens geradas pelo SD, e você pode ter acesso a todas elas utilizando uma simples pesquisa. Confira! (em Português)

VAGAS DA SEMANA

  • Conhecimento avançado em SQL e modelagem de dados;

  • Conhecimento intermediário em Python, Pandas, Pyspark;

  • AWS (especialmente EC2, S3, Glue e Athena);

  • Conhecimento intermediário em Git;

  • Básico em utilização de Linux;

  • Cloud Computing

  • Git, Jenkins, Terraform ou Cloudformation;

  • Solução de MLOps: Sagemaker, Kubeflow, MLFlow, Feast ou Kedro;

  • Hadoop, Spark, Kafka ou Flink;

  • Experiência em Tensorflow, Scikit-learn, LightGBM, MLlib, etc.

  • Linguagem de programação (Python ou Java/Scala)

Eu conto, ou vocês contam?

Finalmente o pessoal do The Pudding fez um dos estudos que eu mais gostaria de ler: o quanto que o TikTok impacta na indústria da música, hein? Eles fizeram uma análise dos artistas que bombaram no Spotify de Janeiro de 2020 a Dezembro de 2021, e uma das suas descobertas foi que 25% dos artistas bombaram no TikTok antes do sucesso. (em Inglês).

Nvidia GTC: a conferência de AI da Nvidia19 a 22 de Outubro - Evento Gratuito e 100% OnlineCoalesce: The Analytics Engineer Conference17 a 21 de Outubro - Evento Gratuito e 100% OnlineImpact: The Data Observability Summit25 e 26 de Outubro - Evento Gratuito e 100% Online

AWS Community Day Brazil05 de Novembro - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.