AI invadiu o mundo dos podcasts (e até ressuscitou o Metaverso) 🤓

Roadmap para projetos em DE; Demanda por GPUs está sobrecarregada; 17 metricas para profissionais de dados;

Como estão, Data Hackers? Vamos começar mais uma semana com as notícias mais interessantes que movimentaram o universo dos dados?

Pra começar, a volta dos que não foram: dado como morto por muitos, o Metaverso voltou a ser comentado depois da Meta apresentar a nova versão de um recurso para criar avatares fotorrealistas - e que impressionou até os críticos da empresa, que certamente não são poucos.

Além dessa demonstração, que aconteceu no podcast do Lex Fridman e fez barulho, trazemos ainda um guia com dicas práticas para quem pensa em migrar para a área de dados (dicas tanto para perceber se há afinidade quanto sobre o percurso de aprendizado) e a forma como tecnologias deepfake estão sendo usadas para vender produtos na China.

Veja alguns dos principais conteúdos da news de hoje:

Legenda: Construção do avatar do Zuckerberg no Metaverso

Muita gente já havia se antecipado em cantar o fim do Metaverso, o mundo paralelo pelo qual a empresa de Mark Zuckerberg foi criticada em diversas ocasiões. Mas uma recente tecnologia para criação de avatares surpreendeu a internet: uma entrevista dada por Zuckerberg ao podcast do Lex Fridman na verdade não foi presencial, mas possibilitada pelo uso de avatares fotorrealistas, o que impressionou os usuários das redes sociais.

Se quiser ver exatamente o momento dos dois dentro do Metaverso veja esse video do Lex Fridman. (Será que o Mark Zuckerberg enfim deu a volta por cima e vai calar os críticos do Metaverso, como "esse que vos fala”? 😬)

A tecnologia utilizada foi o Codec Avatars, que tem como objetivo criar avatares totalmente fotorrealistas e em tempo real que funcionam por meio de headsets com sensores de rastreamento facial. A apresentação ocorreu apenas um dia depois da Meta apresentar sua resposta ao ChatGPT.

Além disso outra notícia relacionada a inteligência artificial que agitou o mundo dos podcasts veio do Spotify. A nova tecnologia lançada vai permitir que os podcasts sejam dublados em diferentes línguas mantendo a voz original dos criadores do conteúdo. Bom se quiser conferir na prática como funciona esse link explica melhor o que tem por trás dessa nova tecnologia, e o exemplo é justamente com o podcast do Lex Fridman.

Já imaginou quando todas essas novidades se juntarem? Avatares realistas dublados em múltiplas línguas dentro do Metaverso? Será esse o futuro das novelas mexicanas? (em Português)

O crescimento vertiginoso em investimento, importância e prestígio que a área de dados teve nas últimas décadas, e que colocou seus profissionais entre os mais bem pagos do mercado, fez com que muita gente pensasse em migrar para a área. Como saber, no entanto, quando alguém apresenta de fato afinidade com a área?

Neste artigo, o Data Hacker João Pedro Reis Silva - que fez, ele próprio, uma transição de carreira - apresenta dicas práticas para constatar quando há gosto pela área ou não. Além disso, o percurso para se tornar um analista de dados é apresentado dividido em etapas, mostrando os passos e o que se deve buscar em cada fase de forma clara e objetiva. (em Português)

Desde que a existência das tecnologias deepfake foi divulgada, houve discussões em várias esferas da sociedade e qualquer possibilidade do uso comercial foi descartada. Mas, na China, isso está mudando.

No país asiático, o uso de lives de influencers para vender produtos é algo disseminado há anos, com alguns apresentadores vendendo mais de um bilhão de dólares em uma única noite. O custo de treinar influencers e cuidar de detalhes técnicos, no entanto, inviabilizava o recurso para algumas empresas.

Agora, milhares de empresas oferecem a criação de avatares deepfakes para vender produtos a custos extremamente atrativos: apenas alguns minutos de vídeo (para referência) e cerca de mil dólares podem garantir um apresentador que trabalha 24/7. (em Inglês)

OUTROS TÓPICOS

Este tutorial apresenta de maneira prática como utilizar Previsões Conformes em modelos de Regressão, abordando questões como o que é a Regressão Média Conformalizada e qual é a diferença entre Intervalo de Confiança e Intervalo de Previsão. (em Português)

Este artigo apresenta um roadmap criar projetos de engenharia de dados de forma incremental, passando por aspectos como a criação de pipelines diferentes com base nos mesmos princípios, a qualidade dos dados, escabilidade e otimização. (em Inglês)

Artigo que começa apresentando o conceito do que são métricas e em seguida introduz um total de 17 tipos de métricas que todos os profissionais de dados devem conhecer para desenvolver um trabalho mais embasado e consistente. Veja bem: não são 17 métricas específicas e sim 17 tipos de métricas, como as medidas, as calculadas, as modeladas, as intensivas e as extensivas. Fundamental para classificar e diferenciar os dados que usamos no dia a dia. (em Inglês)

Há poucos dias, Mark Zuckerberg anunciou que, seguindo a corrida que tantos gigantes da tecnologia fazem atualmente para inserir recursos de IA generativa em seus produtos, a Meta vai em breve disponibilizar IA no WhatsApp, no Instagram e no Facebook. Além disso, uma nova linha de óculos Ray-Ban vai contar com IA da Meta para controlar a luminosidade e oferecer informações a que os usa, por exemplo. (em Inglês)

Análise de curto e médio prazo sobre o grande aumento de demanda por GPUs. O artigo levanta questionamentos sobre quanto valor está sendo efetivamente gerado por todas essas GPUs demandadas. (em Inglês)

A startup de IA Anthropic (que é criadora do Claude, o principal concorrente do ChatGPT) vai receber da Amazon um investimento que pode chegar aos US$ 4bi. O deal torna a AWS a principal provedora de nuvem da Anthropic, com a plataforma sendo usada inclusive para o treinamento de modelos, e o Claude será integrado ao Bedrock da AWS, com os usuários da plataforma tendo acesso antecipado a novas tecnologias desenvolvidas. (em Inglês)

De acordo com o jornal Wall Street Journal, a OpenAI estaria considerando a possibilidade de suas ações. Essa venda teria como objetivo elevar o valuation da companhia de US$ 29 bilhões para algo entre US$ 80 e 90 bilhões. A OpenAI, que tem a Microsoft como dona de 90% de suas ações, reportou que planeja fazer US$ 1 bi em faturamento esse ano. (em Inglês)

DICA DE VÍDEO

Neste vídeo Jeremy Howard, cofundador da fast.ai e criador da abordagem ULMFiT (na qual todos os modelos de linguagem modernos, chamados de LMs, se baseiam), explica de forma didática os LMs. Começando com os conceitos básicos, Jeremy apresenta a arquitetura e a mecânica que faz com que esses sistemas de IA funcionem. Em seguida, ele se aprofunda nas avaliações críticas do GPT-4 apresentando casos de usos práticos e dando dicas práticas para trabalhar com a API OpenAI. O vídeo aborda ainda tópicos técnicos, como fine tuning, decoding tokens e como utilizar instâncias privadas para treinar modelos GPT. (em Inglês)

VAGAS DA SEMANA

Remoto

  • Formação superior completa em Exatas ou TI;

  • Python (domínio);

  • Experiência comprovada de 4 anos ou mais em Engenharia de Dados e disciplinas correlatas;

  • Conhecimento de Ferramentas de Orquestração de Pipeline (Airflow, NiFi ou outras);

  • Conhecimento de clouds públicas (AWS, Azure, GCP);

  • Vivência com priorização de demandas de negócio.

São Paulo - SP - Híbrido

  • Formação em Ciência da Computação, Engenharia de Software ou áreas correlatas (mestrado é um diferencial);

  • Inglês avançado;

  • Experiência com soluções de dados em nuvem (AWS, Azure, Google Cloud);

  • Bancos de dados de big data (Hadoop, Spark ou equivalentes);

  • Redes neurais recorrentes;

  • Frameworks de machine learning;

  • Configuração e manutenção de ambientes de programação estilo Jupyter;

  • Habilidades de programação (Python, R ou outras linguagens relevantes para dados).

MEME DA SEMANA

Você também esté fazendo de tudo… pode falar a verdade…

mais memes como esse no nosso canal do slack

DATA VISUALIZATION DA SEMANA

O treinamento de IAs generativas fez a demanda por GPUs disparar, mas qual seria o impacto dessa demanda nas ações das fabricantes dessa tecnologia?

Neste Dataviz é possível ver detalhes sobre o desempenho acionário da NVIDIA - gigante da tecnologia e uma das maiores fabricantes de GPUs do mundo - nos últimos anos. Dados como a receita trimestral, o lucro líquido e a forma como a empresa ganha dinheiro são apresentados em detalhes, e permitem dimensionar melhor o efeito do “boom” recente da IA.

(em Português)

  • 21 de outubro - Belo Horizonte - MG

  • 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link (vagas esgotadas!)

  • 26 de outubro - 18:30h - Presencial (São Paulo - SP) e Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo