O guia completo para quem quer se tornar um Cientista de Dados em 2024

E mais: Lendo 1TB de dados no seu laptop utilizando Python; Como gerenciar pessoas que não estão performando bem

Fala aí galera! Bora começar agosto se informando sobre o que tem rolado no universo dos dados?

Essa é a newsletter do Data Hackers, a melhor forma de iniciar a semana por dentro das principais novidades do mundo dos dados e AI.

Aproveitando, esses são alguns dos destaques de hoje:

P.S.: Ainda não é assinante da newsletter? Clique aqui para se inscrever gratuitamente

Podcast da Semana

Nos últimos anos, a pesquisa State of Data Brazil destacou as barreiras enfrentadas por pessoas com deficiência para se tornarem profissionais da área de dados e conseguirem progredir na carreira.

Nesse podcast, discutimos como empresas e líderes podem criar ambientes de trabalho que valorizem habilidades, adaptando processos seletivos e práticas para acolher profissionais com deficiência. Também exploramos o papel das ferramentas de IA Generativa na melhoria da acessibilidade e como tem sido sua adoção.

Para isso, contamos com um time especial de convidadas: Géssica Pereira, deficiente visual total e Data Science Specialist; Maristela Salle — Gerente Sr. de Dados e AI; e Luíza Tocchetto — Especialista Diversidade Inclusão; todas atuantes no Grupo Boticário.

No fim, além de oferecer conselhos para quem deseja ser parte dessa transformação inclusiva nossa convidada Géssica compartilha uma mensagem inspiradora para outros profissionais com deficiência que buscam construir uma carreira na área de dados. Vale ouvir!

Com o boom dos dados na última década e o número de pessoas interessadas em migrar de carreira, há inúmeros guias e roadmaps internet afora voltados para quem quer se tornar um cientista de dados. Mas paradoxalmente, o alto número de opções pode até jogar contra, no sentido que fica difícil saber quais conteúdos são de fato relevantes e merecem ser seguidos. Este repositório se mostra bem completo e didático: contém recursos que vão desde blog posts até como se preparar para entrevistas. Puro ouro! (em Inglês)

Um workshop gratuito onde você vai aprender a utilizar na prática 20 ferramentas de AI

Em uma parceria com a GrowthSchool estamos divulgando esse workshop, quando você clicar no link eles vão te oferecer materiais extras por US$ 19, mas não é necessário comprar, o workshop é gratuito e o link será encaminhado pelo Whatsapp. (O workshop é totalmente em inglês)

AI & ChatGPT Mini Crash Course - Eliminate workplace burnout & save 16+ hours every week. Learn 20+ AI tools, prompting techniques & hacks for free.

Obs: Os links acima são patrocinados, ao clicar você apoia a comunidade Data Hackers, escolha a opção "Skip Forever” para ter acesso ao conteúdo gratuito.

Ao trabalhar com datasets muito grandes, é comum incorrer em erros de falta de memória, os chamados “out-of-memory (OOM) errors”. E isso acontece por um motivo simples: quando boa parte dos dataframes foram criados, não era imaginável ter que analisar 100 GB ou 1 TB de dados como se faz hoje.

É possível, no entanto, analisar grandes quantidades de dados sem possuir tanta memória RAM: este artigo traz um tutorial de como analisar 1 TB de dados em um laptop usando o dataframe Ibis. (em Inglês)

O baixo rendimento é algo comum no mundo corporativo, e todo gerente vai precisar lidar com isso em algum momento. Performances aquém do esperado podem ter basicamente dois motivos (sem qualquer relação entre eles): problemas no alinhamento e falhas na execução.

Este artigo traz um guia prático de como investigar os motivos que levam a uma baixa performance e como agir em cada caso, passando por aspectos técnicos, relacionais e pessoais. (em Inglês)

OUTROS TÓPICOS

O Ministério da Ciência e Tecnologia divulgou na última semana o Plano Nacional de Inteligência Artificial. Ainda dependendo de validação pelo Palácio do Planalto para entrar em vigor, o Plano prevê o investimento de R$ 23 bilhões até 2028, entre incentivos para a indústria brasileira de IA, repasses para a construção de infraestruturas locais e até o desenvolvimento de um “supercomputador” para ser usado em parcerias com empresas. (em Português)

O X (antigo Twitter) inseriu em suas configurações um termo sobre o uso de dados de usuários para treinamento de IA, e esse termo já vem marcado automaticamente como se o usuário tivesse consentido. Mas calma: ainda é possível desautorizar esse uso por parte de Elon Musk e sua turma. Leia esse artigo para aprender como. (em Inglês)

A OpenAI não para: depois de lançar o modelo de IA de baixo custo GPT-4o mini e a resposta por voz no GPT-4o, que gerou polêmica com a atriz Scarlet Johansson acusando a empresa de clonar sua voz, a big tech anunciou o lançamento de um sistema de busca próprio para concorrer com o Google. Chamado de SearchGPT, o novo sistema está sendo testado por um grupo limitado de usuários, será em breve disponibilizado como um protótipo em um navegador da web e poderá ser adicionado ao ChatGPT. (em Português)

Pode parecer inacreditável, mas a Alexa, provavelmente a assistente virtual mais conhecida do mercado, tem grande chance de ser descontinuada. Desde que foi lançada há 8 anos, a Alexa jamais deu lucro: era vendida quase a preço de custo buscando invadir os lares e monopolizar o mercado da automação residencial. Havia a expectativa de que as equipes de IA e engenharia conseguissem monetizar a assistente, mas isso nunca se concretizou, e só nesse ano, o setor da Amazon responsável pela Alexa gerou US$ 10 bilhões de prejuízo. (em Inglês)

DICA DE VIDEO

A nova versão do Llama foi lançada semana passada, impressionando a todos pelos resultados em matéria de benchmarking. Mas é aquela história… Benchmarkings podem mentir, né? A melhor forma de constatar as reais capacidades de um modelo é testando ele. Nesse vídeo, os caras do Fireship põem a mão na massa e testam um pouco das capacidades reais desse gigante. Bem interessante de assistir. (em Inglês)

VAGAS DA SEMANA

Remoto - Todo o Brasil

Remoto - Todo o Brasil

MEME DA SEMANA

Acesse nosso canal do slack para mais memes como esse!

DATA VISUALIZATION DA SEMANA

O The Pudding é um portal muito conhecido aqui na comunidade por seus storytellings incríveis. Mas será que, com a equipe do próprio site orientando um modelo de IA generativa, esse modelo conseguiria criar um storytelling tão bom quanto os usados no site? A turma do The Pudding topou o desafio, até como forma de avaliar a capacidade de uma IA de substituir o trabalho humano, e tentou orientar o Claude, da Anthropic, para criar um sotytelling. Vale conferir o resultado. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

  • 6 de agosto - Online

  • 15 de agosto - São Paulo-SP

  • 18 a 20 de setembro - São Paulo-SP

  • 16 a 21 de outubro (Submissão de Atividades até 10 de agosto) - Rio de Janeiro-RJ

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Quer fazer uma parceria com a comunidade Data Hackers?

Amplie a visibilidade da sua marca e produto entre as principais lideranças em dados, garantindo que suas iniciativas atinjam diretamente as maiores referências em dados e inteligência artificial do Brasil.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Login or Subscribe to participate in polls.

Logo