Como usar o ChatGPT para fazer análises (incríveis) de dados 📈

E mais: Como o Itaú consegue lidar com uma alta volumetria de dados históricos de extrato?; Agentes de IA: Entenda como funcionam e como vão revolucionar a área de dados

Fala Data Hackers! E aí, partiu começar dezembro dando uma geral nas novidades do universo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

A pesquisa State of Data Brazil 2024 está no ar, chegando a sua reta final e mais de 3.600 profissionais de dados já preencheram suas respostas! 💡

  • Compartilhar a pesquisa no Slack da empresa que trabalha

  • Compartilhar no Linkedin e redes sociais

  • Mandar em grupos de Whatsapp de profissionais de dados

Esta pesquisa é a maior fonte de informação que temos no Brasil hoje sobre carreira e salários dos profissionais de dados, sua ajuda é fundamental para conseguirmos continuar avançando com esse projeto.

Participe da pesquisa, ajude a comunidade, não leva nem 10 min!

Conversamos com o pessoal da Ambev Tech e exploramos como a Ambev, uma das gigantes do setor de bebidas, está revolucionando seus negócios por meio do uso estratégico de dados e inteligência artificial, destacando o impacto transformador dessas tecnologias em suas operações.

Neste episódio do podcast Data Hackers, conheçam conheçam quatro profissionais que estão na linha de frente da transformação: Felipe Contratres (Contra), Diretor de Dados & IA at Ambev Tech; Maria Clara Castro , Cientista de Dados Senior at Ambev Tech; Mario Vieira, Diretor de Dados & IA at Ambev Tech; e Leonardo Rigueto, Diretor de Dados & IA B2B at Ambev Tech. Juntos, eles trazem uma conversa rica em insights, com exemplos práticos de como a inteligência artificial está remodelando operações comerciais e fortalecendo a estratégia de negócios da Ambev.

A maioria das pessoas trata o ChatGPT como um simples chatbot, mas a verdade é que ele é também é uma ferramenta abrangente de análise de dados que pode lidar com vários formatos, incluindo planilhas Excel, CVS, PDFs e até JSON, com um desempenho comparável ao dos humanos em várias tarefas de análise. Esse guia mostra como fazer isso em minutos usando instruções simples, sem precisar ter experiência em programação ou usar um software estatístico caro. (em Inglês)

O Itaú Unibanco e Rede vivenciam hoje uma jornada de modernização de sua plataforma de tecnologia, e isso vai muito além de migração de serviços para a nuvem: inclui a reescrita de aplicações para aproveitar todo potencial de sua infraestrutura, revisitando ou mesmo redefinindo requisitos de negócio.

Este artigo apresenta em detalhes como, usando boas práticas de engenharia de software e gestão de plataforma, o time da empresa teve sucesso em mitigar ineficiências de grandes dados no Dynamo DB/AWS, o que foi fundamental nesse processo de modernização. (em Português)

Os Agentes de IA estão transformando a maneira como lidamos com dados ao usar algoritmos avançados de Machine Learning para analisar grandes volumes de informações, identificar padrões e tomar decisões inteligentes, sendo usados de chatbots a sistemas de recomendação personalizados.

Este artigo apresenta exemplos práticos de utilização dessa tecnologia e quais as principais plataformas disponíveis no mercado, como CrewAI, Langflow, Flowise e Dify, nas quais você pode desenvolver seus próprios agentes para impulsionar seus projetos de dados. (em Português)

OUTROS TÓPICOS

A inferência causal é um dos campos mais importantes envolvendo dados, por permitir estudar relações de causa e efeito de forma robusta através de diferentes ferramentas. Neste artigo, primeiro de uma série, o Data Hacker Edson Junior se volta para o controle sintético, uma das principais ferramentas da inferência causal, que permite medir o impacto de intervenções reais. (em Português)

Definir metas tendo em vista determinados objetivos é sempre um dos maiores desafios de qualquer empresa. Este artigo apresenta como funciona esse processo dentro do Facebook, envolvendo milhares de pessoas durante vários meses de trabalho - e em outros setores da Meta, como no Instagram, é usada uma metodologia bastante similar. (em Inglês)

Durante anos os engenheiros de dados debateram sobre qual formato de tabela open source se tornaria hegemônico. No fim de 2024, no entanto, não resta dúvida: o Apache Iceberg ganhou essa corrida. Mas, diante disso, o que esperar em matéria de novidades para 2025? Aqui você confere várias novidades interessantes voltadas para o Iceberg - e que podem ajudar a concretizar ainda mais sua hegemonia. (em Inglês)

A corrida da IA está acirrada, e o melhor exemplo está nos modelos de raciocínio avançados: só nos últimos dias, três novos modelos de diferentes desenvolvedores chineses foram lançados, prova de como a inovação de código aberto está alcançando gigantes proprietários como OpenAI e seu o1 Preview. Este artigo discute até que ponto os estadunidenses da OpenAI vão conseguir permanecer na frente dos orientais. (em Inglês)

Converter um grande volume de dados online para formatos compatíveis com LLMs se tornou uma necessidade recorrente em vários negócios - e há uma API do Firecrawl que permite agilizar esse processo usando automação e recursos de escalabilidade. Aqui, você encontra um guia completo sobre essa API, incluindo tópicos sobre como lidar com conteúdo dinâmico baseado em JavaScript e ignorar bloqueadores feitos para inibir esse tipo de ferramenta. (em Inglês)

DICA DE VÍDEO

Neste vídeo, o engenheiro de software e produtor de conteúdo sobre AI Tyler Reed mostra passo a passo como criar um agente de AI sem usar uma única linha de código usando o CrewAI, considerada por ele a mais poderosa plataforma multiagente voltada para empresas (como vocês podem constatar pelo thumbnail do vídeo, rs). (em Inglês)

VAGAS DA SEMANA

Remoto

Remoto

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

Você já teve curiosidade de ver uma comparação direta da velocidade com que diferentes linguagens de programação processam 1 milhão de iterações de um loop aninhado ou uma série de Fibonacci? Pois é justamente isso que este Dataviz traz usando uma animação para exemplificar, e com toda uma explicação sobre a metodologia utilizada. Mais ilustrativo que isso, nem desenhando. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

  • 3 de dezembro - São Paulo-SP

  • 4 e 5 de dezembro - Porto Alegre-RS e Online

  • 10 de dezembro - São Paulo-SP

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo