Um guia completo com as estratégias de Prompt Engineering da Uber 📐

E mais: Um resumo dos principais lançamentos do Re:Invent 2024 na área de dados; Como e por que manter projetos Open-Source na área de dados

Fala Data Hackers! E aí, antes que o ano acabe, que tal abrir a semana sabendo do que tem rolado no universo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

A pesquisa State of Data 2024/2025 encerra hoje, e já conta com mais de 4.900 participantes. Não perca a chance de responder e ganhar acesso ao Guia Data Hackers com 30 páginas de análises sobre o mercado de trabalho em dados no Brasil.

Contribua e apoia essa iniciativa da comunidade (não leva nem 7 minutos)!

Hoje é o último dia!

Em uma conversa incrível com os especialistas da Bain & Company, uma das maiores consultorias estratégicas do mundo, exploramos o impacto da inteligência artificial generativa nos negócios e o futuro dessa tecnologia. Falamos sobre como a Gen AI tem transformado a forma como as empresas trabalham, abordando desde as estratégias até a implantação de projetos reais que estão remodelando mercados e entregando resultados tangíveis.

Neste episódio do Data Hackers, conheçam conheçam Felipe Fiamozzini - Sócio na Bain & Company; Lara Marinelli - Lead Machine Learning Engineer na Bain; e Carlos Azevedo - Sócio associado na Bain. Juntos, eles compartilham práticas recomendadas, stacks utilizadas e as tendências emergentes que prometem moldar o futuro da Gen AI nos próximos anos.

A necessidade de fazer experimentos com LLMs de forma dinâmica levou a Uber a criar um kit de ferramentas de Prompt Engineering para oferecer estratégias padrão, incentivando os engenheiros a desenvolver modelos de prompt bem elaborados. Assim, mesmo usuários sem experiência em Machine Learning poderiam controlar a saída dos LLMs com sobrecarga mínima. Neste excelente artigo, eles explicam melhor as estratégias desse kit de ferramentas, e como elas foram desenvolvidas. (em Inglês)

A AWS Re:Invent é simplesmente a maior conferência de computação em nuvem do mundo, e envolve palestras, anúncios de produtos e serviços, exposições de parceiros e sessões de discussão. Realizada anualmente em Las Vegas, nos EUA, atrai os olhares de especialistas em tecnologia do mundo todo.

A edição de 2024 aconteceu entre os dias 2 e 6 de dezembro, e este artigo apresenta os principais lançamentos da conferência na área de dados. Ótimo conteúdo não só para saber o que está rolando, mas para identificar tendências futuras. (em Inglês)

Apesar de existirem inúmeros tutoriais e artigos com dicas de como encontrar um bom projeto Open-Source e se tornar um contribuidor, pouco se fala sobre como criar e manter o seu próprio projeto Open-Source, o que pode ajudar (e muito) a promover sua carreira e ampliar sua rede de contatos.

Este artigo aborda aspectos importantes da criação de um projeto Open-Source (sobretudo na área de dados) e busca desfazer alguns mitos, como o de que é preciso ser um grande especialista para lançar um projeto de código aberto. Puro ouro! (em Português)

OUTROS TÓPICOS

Depois de ter sofrido um vazamento recentemente, o modelo gerador de vídeos Sora, da OpenAI, foi oficialmente lançado. Assinantes do ChatGPT começaram a ter acesso ao novo modelo no início da última semana. A IA cria vídeos de até 20 segundos e resolução de 1080p a partir de prompts de texto, e conta com recursos como storyboard e predefinições de estilo, que podem variar conforme a assinatura. Os resultados vem deixando os usuários boquiabertos. (em Português)

A engenharia de dados se concentra na criação e manutenção de sistemas para coletar, armazenar e analisar dados, colaborando com vários departamentos para atender suas necessidades específicas e usando as ferramentas e plataformas mais recentes para construir pipelines. Este artigo apresenta sete projetos completos de engenharia de dados para ganhar experiência prática na gestão de dados em tempo real com tecnologias como Python, SQL, Kafka e Spark Streaming. (em Inglês)

Segmentar as ofertas de um portal como o AirBnB pode ser complicado: são milhões de usuários com diferentes perfis e objetivos, e a classificação esbarra numa série de questões (um imóvel que tenha uma disponibilidade de 30%, por exemplo, pode tanto estar disponível só aos finais de semana como apenas em alguns meses do ano). Neste artigo, confira como a necessidade de lidar com dados de calendário e inferências diárias levou a empresa a desenvolver uma abordagem prática e escalonável para segmentar suas ofertas. (em Inglês)

As previsões apontavam que 2024 seria um ano marcante para a IA generativa, com casos de uso operacional crescendo e barreiras de entrada diminuindo (alguns otimistas falavam até em inteligência artificial geral, algo que ainda não aconteceu). E para 2025, quais são as tendências? Neste artigo, você confere algumas apostas do investidor Tomasz Tunguz e de Barr Moses, CEO da Monte Carlo. (em Inglês)

O ChatGPT acaba de ganhar compartilhamento de tela e capacidade de analisar vídeos em tempo real. Esses recursos agora fazem parte do chamado modo de voz avançado, e já estão disponíveis aplicativos móveis iOS e Android para usuários ChatGPT Teams, Plus e Pro. Com isso, o modelo da OpenAI passa a rivalizar diretamente com o Projeto Astra do Google, que permite a usuários abrir um chat de vídeo, em que o Gemini 2.0 responde a questões sobre o que identifica no vídeo. (em Inglês)

DICA DE VÍDEO

O Marketing Anaytics é uma poderosa ferramenta para deixar de lado o achismo e os palpites: os dados apontam o caminho de onde vale os profissionais de marketing investirem tempo e dinheiro. Neste episódio do podcast about data, eu, Gabriel Lages, recebo Nilton Ueda, que é uma grande referência na área, tendo trabalhado em projetos de Marketing Analytics em diversos momentos da carreira. Se você quer entender melhor como usar os dados para otimizar suas estratégias de marketing, esse vídeo certamente vai te ajudar muito! (em Português)

VAGAS DA SEMANA

Híbrido - São Paulo-SP

Remoto - Brasil

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Já parou pra pensar nas diferenças entre os profissionais que trabalham em pé e os que trabalham sentados? O pessoal do portal The Pudding fez esse Dataviz interativo que situa várias profissões quanto à forma de trabalho e compara aspectos como renda, a exigência de mais ou menos formação específica e a possibilidade de escolher entre sentar e ficar em pé. E mais: você insere seus dados, e ele te situa em relação às demais profissões! (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

  • 16 de dezembro - Online

  • 17 de dezembro - São Paulo-SP e Online

  • 17 de dezembro - São Paulo-SP

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo