Como o modelo viciante do TikTok funciona? 📱

O modelo da Meta que não durou 3 dias

Fala, Data Hackers! Estamos de volta para mais uma news! Dia de jogo ou não, estamos sempre na sua caixa de entrada pra dar um SHOW DE BOLA nas notícias e novidades do mundo de dados! kkkkEssa news está recheada de novidades bem bacanas! Uma das principais delas é que o TikTok, a rede social que mais cresce no mundo, liberou um artigo explicando como funciona seu Sistema de Recomendação de Conteúdo. Para quem nunca usou a rede, deixe-me explicar (do alto do meu desconhecimento millenial sobre a ferramenta kkk): no TikTok você simplesmente vai rolando para cima e o algoritmo trata de entender os conteúdos que prendem sua atenção por mais segundos que outros. É realmente inacreditável: você mal mal preenche seu perfil ou conecta-se com amigos ou segue pessoas: o TikTok vai te colocar num buraco negro difícil de sair de conteúdos que você gosta! Não deixe de ler o artigo!Mas tem muito mais:

TikTok, a rede social que mais cresce no mundo, liberou um artigo mostrando como funciona seu Sistema de Recomendação, responsável por manter o maior "tempo de tela" de todos os apps do mundo. E o mais incrível, é que o modelo pouco se basea no perfil do usuário ou nos perfis que ele segue. Ele é fortemente orientado pelo comportamento do usuário ao assistir os conteúdos rápidos da plataforma e utiliza técnicas avançadas para filtrar "bolhas" ou conteúdos muito repetitivos.Eu entendo bulhufas de Sistemas de Recomendação, achei interessante que a arquitetura precisa de realtime fino com Apache Kafka, para conseguir fazer treinamento online em alta-performance.Para quem é apaixonado por RecSys ou por Machine Learning em geral, é um must ler e entender esse artigo. Imperdível!Link para o artigo aqui. (em Inglês)

HOJE é o último dia para compartilhar mais infos da sua carreira conosco!

A Meta tinha lançado recentemente o seu grande modelo de IA que conversa e aprende em conversas com seres humanos, o Galactica. Mas, em menos de 3 dias, já tirou a demo que tanto fez buzz para galera usar do ar, frente a um rampante de críticas de grandes experts no assunto. Modelos desse tipo já deram bem ruim no passado, principalmente por reproduzir viéses e se tornarem máquinas de ódio e absurdos.

Mesmo assim, a Meta colocou o seu modelo no ar que foi testado por vários cientistas. Um dos principais problemas identificados era que Galactica não conseguia separar uma fake news da realidade kkkk Quem diria né?! Muito interessante o artigo do MIT Review sobre o caso, não deixe de ler! (em Inglês)

 

Já podemos dizer que Jupyter é a IDE de Cientistas de Dados. Um dos ambientes mais diversos e produtivos atualmente para desenvolvimento, é nosso queridinho. Mas existem muitos segredos e boas-práticas que devem ser seguidas para tirar todo o poder dessa ferramenta.

Quer ficar por dentro de como a plataforma de desenvolvimento web Jupyter Notebook pode te ajudar nas prototipagens rápidas de experimentação em ciência de dados e análise exploratória?

O Henrique Branco, Engenheiro de Machine Learning do Grupo Boticário, te conta as vantagens e desvantagens nesse artigo. Imperdível! (em Português)

Imagina sua empresa receber investimento da Open AI? Legal demais né? É o que aconteceu com a Harvey, startup que usa IA para apoiar advogados a entenderem o conteúdo de grandes processos. Os fundadores da Harvey trabalharam na Google Brain e também na Meta AI, são referências no desenvolvimento de modelos NLP, como o GPT-3. (em Inglês)

Um dos modelos que estão impressionando o mundo já lançou sua versão 2.0! O Stable Diffusion 2.0 usa um novo text encoder, que aumentam a qualidade dos resultados do modelo. O Upscaler para gerar imagens em Super-Resolução também teve melhorias. (em Inglês)

Você viu que o próprio TikTok usa o Apache Kafka no centro de sua arquitetura do sistema de recomendação né? Então nem preciso falar o quão importante é para Eng. de Dados ou de Machine Learning entenderem dessa ferramenta incrível. Nesse post, estão compilados os cursos mais atualizados e recomendados para dominar o streaming de dados mais usado no mundo. (em Inglês)

Conferencia de Computational Intelligence da IEEE na LATAMUma das maiores organizações referência em Engenharia e Ciência, a IEEE, hosteou uma conferência na América Latina que contou com várias pessoas referências brasileiras e latinas em IA, como: Fernando Buarque, da Escola Politécnica da Universidade de Pernambuco e Gerardo Rubino da Inria na França. Esse link é para a seção de quarta, mas o canal tem todos os outros dias. (em Inglês)

VAGAS DA SEMANA

  • Conhecimentos sólidos em Estatística, Machine Learning, modelagem supervisionada e não supervisionada;

  • Conhecimento em Python e/ou R;

  • Conhecimento em SQL;

  • Pensamento analítico e criativo

  • Interesse por conhecer cada vez mais sobre a área de negócio

  • Formação superior em Ciência/Engenharia da Computação ou áreas similares;

  • 5+ anos de experiência na função de Engenheiro de Dados;

  • Conhecimento avançado de SQL;

  • Experiência na construção e otimização de pipelines de dados, arquiteturas e fontes de dados;

  • Experiência com pipeline de dados: Airflow, Step Functions, etc;

  • Experiência com AWS: S3, Lambda, Glue, EC2, EMR, RDS, MWAA;

  • Experiência com programação Python (Lambdas);

  • Inglês avançado.

- Uma IA pode escrever consultas SQL eficientes?- Você pode?CRYYY kkkk 🥲Dica do Rodrigo Teoria no nosso Slack

O espaço do domínio do Mercado Livre como maior e-commerce do Brasil vem diminuindo. Além da gigante Amazon que saltou a frente dos outros players nos últimos meses, o novo entrante Shopee vem numa crescente incrível desde 2021. Nessa Viz do Snaq no Instagram, você pode acompanhar essa corrida e, em outros cards, mais detalhes desses números. Olha lá! (em Português)

AWS Re:Invent28 de Novembro a 02 de Dezembro - Parte Online gratuitaPrograma de Verão IME 2023 Janeiro e Fevereiro de 2023 - Diversos cursos a preços acessíveis (R$ 60 a R$ 500)Obs: O programa também conta com alguns cursos gratuitos.

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.