• Data Hackers Newsletter
  • Posts
  • ChatGPT ficou doidão? IA começa a dar respostas sem sentido para milhares de usuários

ChatGPT ficou doidão? IA começa a dar respostas sem sentido para milhares de usuários

E mais: O que muda nas principais carreiras em dados com o avanço da IA; Como saber se seu projeto de dados vai falhar antes mesmo de começar

Fala, Data Hackers! Bora fechar fevereiro desse ano bissexto se atualizando sobre as novidades do universo dos dados?

Hoje trazemos os problemas que o ChatGPT apresentou na última semana e que surpreenderam milhares de usuários, além de um artigo sobre o impacto que a IA deve ter nas carreiras dos profissionais de dados e um guia com padrões observados em projetos de ciência de dados que tiveram sucesso.

Confira outros destaques dessa edição:

No novo episódio do Staff+, nosso podcast para quem quer seguir carreira técnica em Tecnologia e Dados, trazemos uma conversa sobre fluxo de dinheiro no mercado de tecnologia e a percepção de salários e compensações, que sempre foram um grande tabú, nesse momento da indústria. Paulo Vasconcellos, Marlesson Santana e Flávio Clésio abordam assuntos como taxas de juros e o fluxo de dinheiro entre fundos de venture capital, e como tudo isso se reflete na estrutura salarial, levando a possíveis distorções no mercado.

Quer entender os fatores e dinâmicas que podem efetivamente influenciar nos salários? Ouça agora mesmo na sua plataforma favorita!

Na última terça-feira, o ChatGPT começou a soltar uma série de respostas fora do esperado: usuários comentaram que o modelo teria “ficado doidão” ou estaria “tendo um derrame”. Embora o ChatGPT obviamente não seja humano, a forma como as pessoas interagem com o modelo dá margem a esse tipo de metáfora. O problema foi corrigido no dia seguinte mas, como nunca ficou tão clara a forma como o ChatGPT atua, ainda não se sabe ao certo o que rolou (apesar da OpenAI ter soltado uma vaga nota de explicação). Confira aqui algumas respostas bizarras dadas pelo modelo e as principais especulações sobre o possível problema. (em Inglês)

As novas possibilidades trazidas pela inteligência artificial dependem de quantidades enormes de dados para o treinamento dos modelos - e como resultado, profissionais de dados estão repensando seus papéis nas empresas.

Ainda que seja pouco provável que a IA consiga substituir profissionais de dados, programas que usam IA podem turbinar as capacidades desses profissionais, e aqueles que tem ambição devem buscar adquirir novas habilidades ligadas a IA que podem ser demandadas. Este artigo traz um panorama do impacto que a IA pode ter nas carreiras de dados. (em Inglês)

O percentual de falha em projetos de ciência de dados está entre 70 e 85% - e ainda assim, as empresas seguem investindo pesado na área, que ainda tem uma demanda por profissionais maior do que a oferta disponível atualmente. Mas o que faz com que tantos projetos falhem?

Após analisar centenas de projetos ao longo dos anos, o cientista de dados Stephen Pettinato compartilha neste artigo padrões que observou em projetos que tiveram sucesso, e que estão presentes antes mesmo do tudo começar. O artigo traz ainda um template para projetos baseado nesses mesmos padrões. (em Inglês)

OUTROS TÓPICOS

Qual é a melhor validação cruzada para o seu projeto de ML?
Para avaliar o desempenho de um modelo de Machine Learning é usado um conjunto de dados para o treinamento e outro diferente para o teste, mas há também a validação cruzada, um processo iterativo onde esta separação de treino-teste é realizada diversas vezes com algum nível de variabilidade para as observações usadas em cada recorte. Aqui, o Data Hacker Vitor Ferreira Lins apresenta os tipos de validação cruzada e em qual situação cada um deles é mais adequado. (em Português)

Testes A/B sequenciais: Entenda como os dados deixam as pessoas viciadas em Netflix
O vício no Netflix não é obra do acaso e tem muito a ver com dados: a plataforma usa testes A/B sequenciais para medir seu sucesso a cada atualização, se servindo de métricas como o delay para carregar os filmes e séries. Esta é a primeira parte de uma série de artigos que detalha a relação entre os dados e a Netflix, escritos pela própria equipe da plataforma. (em Inglês)

Fullstack Data Scientists: Onde vivem? O quê comem? Será que eles existem?
A relação próxima entre a Ciência de Dados e Desenvolvimento de Software levou a turma dos dados a “importar” vários termos usado pelos colegas de software, e assim como existe o desenvolvedor fullstack, que desenvolve tanto frontend quanto backend, começou a se falar em cientista de dados fullstack. Mas quem seria esse profissional, afinal? Este artigo discute o que seria de fato um fullstack data scientist e as principais competências que esse profissional precisa ter. (em Inglês)

Como o time de engenharia do ChatGPT conseguiu escalar a aplicação e suportar mais de 100M de usuários
Quando foi lançado em novembro de 2022, o ChatGPT ganhou o mundo, encantando os usuários e se tornando o mais popular símbolo da nova era da inteligência artificial. Um ano depois, o modelo tinha mais de 100 milhões de usuários por semana, um crescimento sem precedentes nesse campo. Já parou pra pensar nos desafios que um crescimento desses envolve? Este artigo detalha todos os desafios enfrentados pela equipe de engenharia nesse tempo, tudo relatado por Evan Morikawa, líder do time. (em Inglês)

Um roadmap para análises de séries temporais (Time Series)
As análises de séries temporais (time series analysis) são um recurso precioso na Ciência de Dados, mas nem por isso são simples de usar: além da capacidade de análise, é preciso compreender como funciona a dinâmica por trás desse recurso, e que é cheia de nuances. Este artigo apresenta um roadmap para, partindo do zero, dominar as séries temporais. (em Inglês)

DICA DE VÍDEO

Como o universo dos dados e da inteligência artificial / machine learning interagem e se influenciam? Este podcast, apresentado por Jake Watson, engenheiro de dados no The Oakland Group, discute questões como a importância da modelagem e da qualidade dos dados em ML e AI e a necessidade de saber lidar com a dispersão de dados em toda uma série de situações. (em Inglês)

VAGAS DA SEMANA

Remoto

  • Habilidade comprovada em Gestão de pessoas;

  • Experiência prévia na criação e gestão de produtos de dados;

  • Liderar o time de Product Manager (PM), Product Owner (PO) e Associated Product Owner (APO) e garantir a eficiência da estrutura;

  • Senso de prioridade, boa capacidade analítica e visão estratégica para tomar decisões rápidas, baseada em dados e coerentes com a estratégia;

  • Conhecimento em metodologias ágeis.

Rio de Janeiro-RJ - Híbrido

  • Experiência com análise e modelagem numérica;

  • Conhecimentos em modelos preditivos de Machine Learning de classificação (preferência por foco em Texto, Imagem e/ou Dados estruturados);

  • Habilidade de conduzir análises quantitativas consistentes da abordagem à apresentação dos resultados;

  • Habilidade para documentar e comunicar insights orientados a dados para colegas de diferentes backgrounds;

  • Escrita de código em nível de criação de protótipos, sem depender de engenheiros de software.

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

A trajetória das mulheres no mercado de trabalho ao longo dos últimos 70 anos passou longe de ser linear, e mesmo hoje o percentual da participação feminina no mercado está estagnado ou até diminuindo em alguns casos. Um estudo recente ajuda a entender o motivo: ter filhos causa um grande impacto na carreira das mulheres em todo o mundo, causando o que os pesquisadores chamam de “pena da maternidade”. Usando dados de 134 países, o estudo, aqui apresentado pela revista The Economist, propõe uma nova abordagem para medir esse fenômeno. Vale conferir a diferença do impacto em cada país, mas não se engane: infelizmente, o efeito é significativo em todos eles. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

Meetup Python MG
28 de fevereiro - Belo Horizonte-MG

Open Data Day Recife
(inscrições abertas para palestrantes aqui)
2 a 8 de março - Recife-PE

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo