Overfitting é necessariamente algo ruim? 🤔

E mais: Um jogo para aprender SQL desvendado crimes; Usar ChatGPT faz mal para o meio ambiente?

In partnership with

Fala Data Hackers! Antes de cair na folia (ou no descanso) com a chegada do carnaval, que tal abrir a semana sabendo do que tem rolado no mundo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

Neste post provocativo, o cientista da computação Ben Recht questiona a noção comum de overfitting na ciência de dados e em Machine Learning. Recht argumenta que o termo é uma racionalização pós-fato de previsões erradas e propõe que repensemos a maneira como avaliamos nossos modelos. Ele também critica conselhos clássicos sobre como evitar o overfitting, chamando-os de dogmas que, segundo ele, seriam mais prejudiciais do que úteis. O texto é um convite a reavaliar práticas convencionais e buscar uma nova forma de lidar com erros nos modelos de Machine Learning. (em Inglês)

Dica de Newsletter de IA

Quer acompanhar de perto todas as novidades do mundo da AI e conhecer as ferramentas e apps de AI que mais fazem sucesso?

A "The Rundown AI” é uma das mais relevantes newsletters sobre AI, e agora se tornou parceira da comunidade Data Hackers, cadastre-se gratuitamente no link abaixo e tenha acesso as novidades semanalmente.

Learn AI in 5 minutes a day

This is the easiest way for a busy person wanting to learn AI in as little time as possible:

  1. Sign up for The Rundown AI newsletter

  2. They send you 5-minute email updates on the latest AI news and how to use it

  3. You learn how to become 2x more productive by leveraging AI

Obs: Essa é uma parceria, para cada pessoa que clicar no link (a inscrição é gratuita) eles fazem uma doação para a comunidade Data Hackers (se quiser clicar vai ajudar a gente, e ainda conhecer os conteúdos da The Rundown, uma das mais respeitadas newsletters sobre AI atualmente 🥸).

Que tal aprender SQL enquanto se diverte desvendando crimes? É exatamente essa a proposta desse jogo, que aposta no entretenimento para facilitar o aprendizado dessa linguagem que hoje é um dos principais pilares para profissionais que trabalham com dados de forma geral.

Em "SQL Noir" você vai resolver crimes precisando, para isso, aprimorar suas habilidades na chamada linguagem de consulta estruturada, o popular SQL. Excelente oportunidade de aprender uma habilidade valiosa de forma leve, e ainda remetendo a um imaginário tão explorado em filmes e séries. (em Inglês)

Neste artigo, Andy Masley desmistifica a ideia de que usar modelos de IA como o ChatGPT pode ser prejudicial ao meio ambiente. Ele destaca, com base em cálculos e comparações, que o impacto do uso individual do ChatGPT é pequeno quando comparado a outras atividades cotidianas.

O autor apresenta uma crítica à desinformação que associa alto consumo de energia a um único modelo de IA, sem considerar o valor agregado e a eficiência. Discute, ainda, o uso de água pelos data centers, colocando em perspectiva as críticas ambientais ao uso da IA. (em Inglês)

OUTROS TÓPICOS

O Paradoxo de Simpson acontece quando uma tendência vista em subgrupos de dados desaparece ou se inverte por uma combinação desses dados, geralmente por causa de variáveis confusas não modeladas. Neste artigo, a cientista de dados Nina Zumel fala sobre esse curioso fenômeno usando uma regressão logística em dados sintéticos de ensaios clínicos. (em Inglês)

Visualizações monocromáticas podem ser um desafio, mas também uma oportunidade de melhorar as habilidades de design envolvendo gráficos. Este artigo da especialista em visualização de dados Nicola Rennie traz dicas sobre como criar gráficos efetivos quando estamos limitados a uma única paleta de cores, o que muitas vezes é necessário por restrições de publicação ou para tornar visualizações mais acessíveis. A autora explora diferentes abordagens, como o uso de padrões e formas, para garantir que suas visualizações sejam eficazes mesmo sem cores vibrantes. (em Inglês)

A Meta está prestes a lançar um novo evento chamado LlamaCon, marcado para 29 de abril e focado em avanços de código aberto em IA. Antes da conferência Meta Connect, que acontece em setembro, são esperadas novidades no desenvolvimento de apps e produtos através do Llama, o modelo de IA de código aberto da empresa. Além disso, há rumores sobre novos óculos inteligentes vindo por aí, o que mostra que o investimento pesado em tecnologia de ponta continua. (em Inglês)

Falando em Meta, ela também está explorando a fascinante interseção entre inteligência artificial e comunicação humana! Imagine prever falas apenas com base em atividades cerebrais. É exatamente isso que o novo modelo lançado pela empresa se propõe a fazer. Embora os detalhes completos ainda não estejam disponíveis, essa combinação inovadora de tecnologia e neurociência promete abrir portas para avanços incríveis na forma como entendemos e interagimos com o cérebro humano. (em Inglês)

A OpenAI está pronta para lançar o GPT-4.5, nova versão do ChatGPT, o que leva a expectativas altas dos usuários e do mercado como um todo. E não é só: já há rumores sobre o GPT-5, que promete integração com o modelo de raciocínio o3 para melhorar a checagem de fatos. Esse lançamento pode acontecer em maio, coincidindo com a conferência dos desenvolvedores da Microsoft. (em Inglês)

A Microsoft está trazendo inteligência artificial para o Xbox com o modelo generativo Muse, que é capaz de criar novas partes para jogos enquanto preserva as clássicas. Desenvolvido em parceria com a Ninja Theory, o Muse foi treinado com anos de dados de gameplay humano, o que permite a ele criar ambientes de jogo a partir de interações reais de jogadores. Apesar de ser um projeto inicial, esse avanço promete abrir novas possibilidades criativas para desenvolvedores de jogos. (em Inglês)

A startup Humane anunciou o cancelamento do AI Pin e a venda de seus ativos para a HP por 116 milhões de dólares. Devido às baixas vendas, o dispositivo já foi descontinuado e, a partir do dia 28 de fevereiro, deixará de funcionar completamente. A HP planeja aproveitar a equipe e a tecnologia da Humane, incluindo o sistema operacional CosmOS, para formar um novo laboratório de inovação em IA, batizado de HP IQ. A Humane buscava uma venda mais valiosa no passado, mas acabou vendo seu produto enfrentar duras críticas, com um número de devoluções superior ao de vendas. (em Inglês)

DICA DE VÍDEO

Um vídeo dos nossos amigos do canal Programação Dinâmica onde testam as novidades de Deep Research da OpenAI, Google Gemini e Perplexity. Será que essas IAs realmente revolucionam a pesquisa acadêmica ou são só mais um motor de busca turbinado? Descubra o que funciona, o que precisa melhorar e as implicações dessa tecnologia para o futuro da pesquisa. (em Português)

VAGAS DA SEMANA

Remoto

Presencial - Rio de Janeiro-RJ

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

As últimas semanas tem sido marcadas por muitos acidentes aéreos ao redor do mundo. Frente a esse cenário, o pessoal do Visual Capitalist preparou esse Dataviz com um panorama dos acidentes aéreos nos EUA de 2004 a 2023. Informações detalhadas dividindo as ocorrências em diferentes categorias de voo, de pequenas aeronaves particulares a grandes companhias aéreas. Vários insights possíveis, incluindo a percepção de uma incidência maior de acidentes em vôos privados. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo