- Data Hackers Newsletter
- Posts
- Google lança um AI Agent de Data Science no Colab 🤖
Google lança um AI Agent de Data Science no Colab 🤖
E mais: O mito de se medir o ROI de equipes de dados; Será que o GPT 4.5 vale o quanto ele custa?
Se inscrever | Parcerias | Podcast | Blog
Fala Data Hackers! Tem gente que diz que o ano só começa depois do carnaval, então que tal começar se informando sobre o que tem rolado no mundo dos dados?
Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.
Aproveitando, esses são alguns dos destaques de hoje:
Um guia completo sobre Visualização de Dados para você nunca mais errar ao escolher um gráfico
Conheça o PikaSwaps, nova IA que consegue trocar elementos e objetos de um vídeo
Um benchmark de times de dados: Tamanho, papéis, responsabilidades
Assista uma IA jogando Pokémon e entenda esse tipo de tecnologia
20 abordagens estatísticas cruciais para cientistas de dados
Usar o ChatGPT não prejudica o ambiente como dizem… E esse post vai te provar isso!
P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente
Agentes de IA estão super em voga, mas que tal um focado especificamente em analisar, classificar e tirar conclusões de grandes volumes de dados? O novo agente de ciência de dados do Google se propõe a fazer exatamente isso: com tecnologia Gemini 2.0, ele automatiza a análise de dados, e já está disponível através do Google Colab. Confira o que esse agente é capaz de fazer, e veja detalhes sobre seu lançamento. (em Inglês)
Quer acompanhar de perto todas as novidades do mundo da AI e conhecer as ferramentas e apps de AI que mais fazem sucesso?
A "The Rundown AI” é uma das mais relevantes newsletters sobre AI, e agora se tornou parceira da comunidade Data Hackers, cadastre-se gratuitamente no link abaixo e tenha acesso as novidades semanalmente.
Learn AI in 5 minutes a day
This is the easiest way for a busy person wanting to learn AI in as little time as possible:
Sign up for The Rundown AI newsletter
They send you 5-minute email updates on the latest AI news and how to use it
You learn how to become 2x more productive by leveraging AI
Obs: Essa é uma parceria, para cada pessoa que clicar no link (a inscrição é gratuita) eles fazem uma doação para a comunidade Data Hackers (se quiser clicar vai ajudar a gente, e ainda conhecer os conteúdos da The Rundown, uma das mais respeitadas newsletters sobre AI atualmente 🥸).
Medir o ROI de uma equipe de dados pode parecer uma tarefa óbvia para quem trabalha transformando tudo em números, certo? Mas na prática, as coisas podem não ser tão simples, e o valor do trabalho de uma equipe pode estar muito além de qualquer métrica. Este artigo explora a dificuldade de quantificar o valor real das atividades de uma equipe de dados, e mostra que a percepção de valor depende mais dos stakeholders que de números: a essência do trabalho está, afinal, sobretudo em suportar o sucesso de outras funções. (em Inglês) | O lançamento do GPT 4.5 foi cercado de grande expectativa, afinal é o modelo que foi treinado com maior poder computacional até agora. Mas o preço, dezenas de vezes mais alto que o de concorrentes ou de modelos anteriores, fez muita gente desanimar. As avaliações, no geral, denunciam que o modelo não vale o que custa. Mas o fato é que seu desempenho é sim diferenciado, com respostas muitíssimo consistentes e naturais. Neste artigo, o pessoal do Venture Beat busca fazer um balanço e responder se o GPT 4.5 é mesmo isso tudo. (em Inglês) |
OUTROS TÓPICOS
Se você já ficou na dúvida sobre qual gráfico usar para aquele seu conjunto de dados, seus problemas acabaram! O site “From Data to Viz” é um verdadeiro mapa do tesouro para escolher a visualização perfeita. Ele oferece uma árvore de decisões guiando você até o gráfico ideal, além de oferecer trechos de código e dicas para evitar erros comuns na visualização de dados. Um verdadeiro must-have para qualquer Data Hacker! (em Inglês)
Imagina só dois agentes de IA conversando entre si ao telefone. Parece ficção científica, mas é real! O projeto Gibber Link apresenta um protocolo inovador para que essas máquinas dialoguem de forma eficiente, evitando desperdícios de tempo e reduzindo custos computacionais. Em vez de conversar em inglês, as IAs trocam dados em um nível sonoro, com um protocolo baseado na biblioteca GGWave. Essa abordagem não só acelera o processo (reduzindo o tempo gasto em até 80%) como também mantém a clareza em ambientes ruidosos e permite a troca de dados multimodais e estruturais. (em Inglês)
Imagina poder trocar qualquer elemento nos seus vídeos usando só com uma foto ou uma descrição? O PikaSwaps, novo modelo de IA que acaba de ser lançado, promete transformar isso em realidade. Segundo seus criadores, essa IA entrega resultados incrivelmente realistas e ilimitados, deixando a criatividade do usuário voar solta. (em Inglês)
Quer saber se seu time de dados está dentro da média do mercado mundial? Aqui, Mikkel Dengsøe compartilha insights com base em centenas de equipes de dados de elite. Confira estatísticas sobre tamanhos de equipe, distribuição de papéis, quantidade de dados-por-engenheiro e até questões salariais. Empresas como Notion, Meta e Monzo servem de base para essas comparações incríveis. (em Inglês)
Confira neste link o Claude, famoso modelo de IA da Anthropic, jogando o clássico jogo Pokémon, e entenda as tecnologias e recursos que permitem a modelos de IA jogar de maneira autônoma, como tantos de nós fizemos na infância.Agora, se a IA se diverte tanto quanto nós nos divertimos no passado, aí é outra história… (em Inglês)
A matemática é sem dúvida o coração da ciência de dados. Embora o machine learning roube a cena, dominar as metodologias estatísticas pode levar suas análises a outro patamar. Este artigo explora 20 abordagens estatísticas fundamentais que todo data scientist deve conhecer. Além das descrições, você confere exemplos práticos e snippets de Python para cada técnica. (em Inglês)
Será que o uso do ChatGPT é realmente tão prejudicial ao planeta? Andy Masley defende que não. Neste artigo, ele desconstrói mitos comuns sobre o impacto ambiental de modelos de linguagem como o GPT-4, afirmando que os números frequentemente são mal interpretados. Por exemplo: o custo energético por pesquisa pode não ser tão alto quanto parece, especialmente quando comparado a outras atividades do cotidiano digital. Além de desmistificar o impacto do ChatGPT, Masley nos convida a não perder de vista os verdadeiros desafios climáticos que enfrentamos. (em Inglês)
DICA DE VÍDEO
Descubra os segredos por trás do treinamento dos modelos de linguagem de 2025! Mario Filho disseca o workflow dos laboratórios em detalhes: desde a coleta refinada de dados até as arquiteturas de ponta e técnicas avançadas como Mixture of Experts. Ideal para engenheiros de ML que querem saber mais sobre essas tecnologias de ponta. (em Português)
VAGAS DA SEMANA
Híbrido - São Paulo-SP | Híbrido - São Paulo-SP |
DATA VISUALIZATION DA SEMANA
Após anos de ascensão do home office, muitos setores nos EUA estão puxando o freio de mão e voltando para o trabalho presencial. Segundo uma pesquisa da McKinsey & Company, o número de trabalhadores in loco dobrou e foi de 34% em 2023 para 68% em 2024, e o pessoal do Visual Capitalist usou dados dessa mesma pesquisa para fazer esse Dataviz, que mostra a situação em diferentes setores. Apesar dessa tendência, ainda há bastante resistência e um desejo forte por modelos de trabalho híbridos ou remotos. (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS
Muito além do SaaS: Arquiteturas Multi-Agentes e o futuro do “Agent-as-a-Service” - 10 de março - Online
AI Dev 25: Conferência de Desenvolvedores - 14 de março - San Francisco, Califórnia, EUA
FIAP Meetup: Estragégias de negócios e IA para as transformações do mercado - 18 de março - São Paulo/SP
Meet DoorDash’s Engineering Team in Brazil - 20 de março - São Paulo/SP
TDC Summit São Paulo - 26 e 27 de março - São Paulo/SP
Web Summit Rio 2025 - 27 a 30 de abril - Rio de Janeiro/RJ
Lista com o calendário de cursos gratuitos do canal Téo Me Why (Git e Git Hub, Python, Pandas, Estatística, Machine Learning,Databricks, SQL, Cloud e muito mais) - A partir de janeiro - Online e gratuito
Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.
Quer fazer uma parceria com a comunidade Data Hackers?
Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.
Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?Pode dar sua opinião sincera... |
Faça Login ou Inscrever-se para participar de pesquisas. |
