7 ideias de projetos com LLMs para incluir em seu portfólio e impressionar seu chefe

E mais: Materiais de extrema utilidade para líderes de dados; O que um Cientista de Dados faz? Salário, habilidades necessárias e como se tornar um DS

Fala aí galera! Prontos para mais uma semana cheia de dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente.

Podcast da Semana

Neste episódio do Data Hackers - A maior comunidade de AI e Data Science do Brasil, conheçam Renata Biaggi, Data Scientist & AI Solutions na Celfocus, e Luna Metz, Tech Recruiter Specialist.

Juntas, elas compartilham como se preparar para entrevistas e processos seletivos em dados, além de histórias inusitadas que marcaram suas jornadas.

Com o objetivo de explorar inovações e tendências do momento em relação à inteligência artificial, a Ambev Tech lança seu terceiro circuito de Meetups Tech&Cheers, edição Data & Analytics.

O evento será realizado no dia 24/07 no escritório da Ambev em São Paulo (SP) a partir das 18h30, em uma parceria especial com a comunidade Data Hackers. Nesta edição, vamos seguir uma programação técnica para discutir sobre IA Generativa, experiência do usuário, personalização de produtos e serviços; além de uma mesa redonda mediada por Daniel Cassiano, Diretor de Data & Analytics da Ambev Tech.

Você não vai querer ficar de fora, vai? Vale lembrar que o encontro será apenas presencial, com vagas limitadas, garantidas conforme preenchimento do formulário de inscrição.

Muita gente acha que trabalhar com LLMs exige conhecimentos avançadíssimos, sendo restrito a poucos engenheiros e desenvolvedores de ponta. Mas e se eu te contasse que só sabendo Python dá pra cobrir uma ampla gama de projetos envolvendo LLMs?

Este artigo apresenta 7 ideias de projetos interessantes e acessíveis envolvendo LLMs, que podem ser feitos usando recursos gratuitos ou de baixo custo. Além disso, cada ideia de projeto vem acompanhada de uma pequena amostra demonstrativa para entender melhor como o projeto funciona. (em Inglês)

Ser um líder de dados em uma empresa pode ser algo bem mais complicado que parece: além de habilidades interpessoais e gerenciais, é preciso ter uma leitura de como a empresa enxerga a carreira em Ciência de Dados e quais as suas expectativas para a área, fazer um alinhamento com RH para contratar novos profissionais e formar seu time, dentre milhares de outras coisas.

Esse post reúne diversos artigos e dicas de livros para trabalhar melhor essa série de questões de forma detalhada. Conhecimento para construir uma liderança sólida e evitar perrengues. (em Inglês)

O destaque que a Ciência de Dados ganhou nos últimos anos e a perspectiva de altíssimos salários (spoiler: perspectiva, essa, nem sempre verdadeira) fez muita gente olhar com carinho para a área e considerar uma mudança de carreira. Mas nem todo mundo entende de fato o que é Data Science e o que significa trabalhar com ela.

Neste artigo, tento resumir direto ao ponto o que é a Ciência de Dados, como trabalhar na área, perspectiva real de salário e o caminho para se tornar um profissional. Uma boa porta de entrada para esse universo. (em Português)

OUTROS TÓPICOS

Depois de analisar 1565 artigos combinando esforços humanos e ajuda computacional, este artigo propõe uma revisão das técnicas de prompt engineering para IA generativa e, ao apresentar 58 técnicas para a escrita de prompts, busca mostrar que prompt engineering pode, sim, ser tão eficiente como fine-tuning. (em Inglês)

Data Lineage é um mapa que rastreia o relacionamento entre as dependências em pipelines de dados, ilustrando de onde vêm os dados, como eles mudam e onde são apresentados aos usuários finais. Este guia aborda os principais conceitos dessa utilíssima ferramenta, indo desde os tipos possíveis de Data Lineage até dicas de como extrair mais valor desse recurso. (em Inglês)

As startups vinham num momento de crise, com muitas delas reduzindo custos, sendo vendidas ou encerrando suas operações. Mas desde o boom da IA no final de 2022, as startups voltadas para essa tecnologia têm seguido um caminho inverso: só entre abril e junho, investidores injetaram US$ 27,1 bilhões em startups de IA nos EUA, quase metade de todo o financiamento recebido por startups no país nesse período. Esta reportagem permite entender melhor esse cenário. (em Português)

No mundo orientado a dados de hoje, a capacidade de analisar rapidamente e com eficiência grandes conjuntos de dados é mais crítica do que nunca, e a resposta da Amazon a essa demanda foi o AWS Redshift: um serviço baseado na nuvem que permite aos usuários armazenar, consultar e analisar grandes volumes de dados. Aqui, você encontra uma análise detalhada sobre o Redshift, suas capacidades e componentes. (em Português)

A memória é um recurso importante ao processar grandes quantidades de dados, trazendo por exemplo rapidez no processamento de consultas. Mas ela é finita e cara, e geralmente não há memória suficiente para manter todas as estruturas de dados necessárias em cache. Este artigo traz algumas dicas práticas para gerenciar melhor a memória usando o DuckDB, uma das ferramentas de gerenciamento mais populares. (em Inglês)

O Google tinha como meta zerar suas emissões de carbono até 2030, mas seu relatório ambiental de 2024 aponta que as emissões da companhia aumentaram quase 50% em comparação a 2019. O aumento é atribuído ao consumo de energia dos centros de dados e às emissões da cadeia de suprimentos, tudo isso relacionado aos avanços da inteligência artificial e à demanda por ela. (em Português)

Quinta 18/07 as 20h no canal do Data Hackers.

Dessa vez o tema da aula ao vivo e hands-on será Trino - Fast distributed SQL query engine.

A aula será conduzida pelo Rodrigo Teoria, que vai te ajudar a fazer um hands-on com essa tecnologia, mostrando passo a passo como funciona essa tecnologia e como você pode utilizar a ferramenta no dia a dia. (em Português)

Junte-se a este curso gratuito e online de introdução à análise de dados, exclusivo para mulheres.

As aulas serão online, ministradas às segundas e quartas-feiras, das 19h às 21h.

*Não tem pegadinha, o curso é 100% gratuito! (em Português)

DICA DE VIDEO

Confira nesse vídeo a aula que oferecemos na última semana em nosso canal do YouTube sobre Data Contracts, conduzida pelo engenheiro de dados Rodrigo Carneiro, o Rodrigo TeORiA. Na aula, ele expôs como o conceito de Data Contracts é fundamental para a maturidade de produtos de dados e para projetos de alta complexidade como Data Mesh e, de uma forma hands-on, abordou o datacontracts-cli e o datamesh-manager. Conteúdo fundamental para quem trabalha com dados e quer aprender a construir produtos mais confiáveis! (em Português)

VAGAS DA SEMANA

Híbrido - São Paulo-SP

  • Processar, modelar e validar grande volume de dados estruturados, para realização de análises e treinamento de modelos de IA (Inteligência Artificial);

  • Organizar, processar, modelar e validar grande volume de dados estruturados, para realização de análises e treinamento de modelos de IA (Inteligência Artificial);

  • Realizar análises, desenvolver e treinar modelos de IA (Inteligência Artificial), dentro de projetos de médio porte e média complexidade.

  • Criar códigos eficientes e fáceis de manter.

Híbrido - Campinas-SP

  • Bacharelado ou Mestrado em Engenharia, Estatística ou Economia;

  • Experiência na construção de modelos de Machine Learning;

  • Forte experiência em codificação Python;

  • Boa base em modelos de ML supervisionados e não supervisionados;

  • Experiência em versionamento de código usando Git (ou similar), mantendo base de código modularizada para múltiplas implantações;

  • Inglês e Espanhol avançado (obrigatório);

  • Experiência comprovada na construção e fornecimento de soluções analíticas;

MEME DA SEMANA

DATA VISUALIZATION DA SEMANA

As fake news são uma grave ameaça à democracia em nível mundial, e o caminho para combatê-las, além de investigar e punir os responsáveis, passa por educar a população para distinguir notícias falsas das verdadeiras. Mas como estão os países em relação a isso? A Organização para a Cooperação e Desenvolvimento Econômico (OCDE) publicou em junho uma pesquisa que mediu a capacidade de as pessoas identificarem conteúdo falso e enganoso online em 21 países, e os resultados estão nesse dataviz feito pelo pessoal do Snaq. (em Português)

PRÓXIMOS EVENTOS E MEETUPS

  • 8 de julho a 2 de agosto - Online

  • 24 de julho - São Paulo-SP

  • 1 de agosto - Santa Rita do Sapucaí-MG

  • 15 de agosto - São Paulo-SP

  • 18 a 20 de setembro - São Paulo-SP

  • 16 a 21 de outubro (Submissão de Atividades até 10 de agosto) - Rio de Janeiro-RJ

  • Inscrições abertas até 31/07

  • 18 de julho (quinta) 20h

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo