GPT-4 sai na próxima semana e ele vai enxergar! 👀

Lançamento de Modern Data Stack made in 🇧🇷;Lançamento de Modern Data Stack made in 🇧🇷 ; IA da Hotmart te dá A DICA para criar seu próprio curso; Publicação dos dados do State of Data Brazil 2022;

Fala Data Hackers, sejam bem-vindos a mais essa news! Essa news tem um monte de lançamento: Tem a Hotmart com uma IA que vai te ajudar a criar um curso, tem os dados do State of Data que tão para ser liberados no Kaggle, tem a Dadosfera publicando seu produto no Product Hunt…

Porém, o destaque vai pro que o CTO da Microsoft Alemanha adiantou pra gente: o GPT-4 pode sair essa semana! Sim, o mais poderoso LLM do mundo vai ter uma nova versão, que é capaz de analisar até imagens!

Mas tem mais novidades legais nessa news, como:

O GPT 3.5 mal mal saiu do hype e a Open AI já, agora em conjunto com a gigante Microsoft, deve lançar seu sucessor, o GPT-4! E ele não vai só receber textos como inputs, ele vai “enxergar”: recebendo imagens para responder e também fine-tunning!

“Apresentaremos o GPT-4 na próxima semana, teremos modelos multimodais que oferecerão possibilidades completamente diferentes – por exemplo, vídeos”, disse Michael Braun, CTO da Microsoft Germany, em comentários divulgados pela mídia alemã Heise.

Um LLM multimodal é capaz de extrair informações de vários tipos de fontes. Isso pode abrir a possibilidade de ele retirar informações de vídeos e imagens que encontra na internet. O GPT-3.5, o atual LLM da OpenAI, é puramente baseado em texto.

Tá animado para ver o que o próximo modelo da Open AI é capaz de fazer? (em Inglês)

Imagina processar bilhões de registros por dia, petabytes de dados, que impactam toda a economia da América Latina? Sim, esse é o dia-a-dia dos profissionais de dados no gigante Itaú. Não só o grande volume impressionante de 26 petabytes de dados, mas o desafio de difundir o benefícios da análise de dados entre os mais de 7000 engenheiros de software e muitos mais profissionais da organização.

Nós do Data Hackers tivemos o prazer de trazer o Moisés Nascimento (Chief Data Officer), a Priscila Cardoso (Superintendente de Gestão de Dados) e o Roberto Figueira (Head de Engenharia da plataforma de Dados) para nos contar tudo sobre a Data Platform do Itaú.

Papo MUITO LEGAL, realmente imperdível! (em Português)

O DataBricks criou um e-book sobre boas práticas e conceitos de engenharia de dados e EM PORTUGUÊS para nos ajudar a evangelizar sobre essa jornada.

O ebook traz 8 casos de uso reais de aplicações em real-time, data lake, lakehouse, além de Cases de sucesso - claro que tinha que ter o jabá - de clientes que usam o DataBricks.

Mas tem várias referências de arquitetura e também definições que fogem do mundo da ferramenta, então vale a pena dar uma olhada! (em Português)

Como é de praxe, vamos liberar no Kaggle os dados da MAIOR PESQUISA sobre o mercado de trabalho em Dados do país!

Os dados já estão disponíveis no Kaggle.

Se prepare, pois logo logo vamos lançar a tão esperada competição State of Data Challenge, onde escolhemos e premiamos as análises mais pertinentes e bonitas sobre os dados!

Acesse, brinque com os dados e compartilhe com seus amigos! (em Português)

OUTROS TÓPICOS

Vazamento de dados, ou Data Leakage, é uma falha de processo que pode ACABAR com uma modelagem de Data Science. O vazamento ocorre quando informações que não deveriam estar disponíveis para o modelo estão presentes nos dados de treinamento. Neste post, a Data Hacker e Médica Letícia Alves nos ensina como usar a técnica SHAP para detectar e sanar esse problema. (em Português)

Ouvir/Ler sobre IA e Dados na mídia tradicional nem sempre é “instigante”, digamos… Mas essa reportagem do Correio Braziliense mandou bem demais! Com a participação de vários especialistas VERDADEIROS no assunto, como nosso amigo Leon Sólon do Let’s Data, a reportagem desmistifica o que tanto o pessoal vem falando do Chat GPT e do futuro dos empregos. (em Português)

A Hotmart criou uma IA - baseada no Open AI - que te ajuda a estruturar toda a ementa e lançamento de um curso na plataforma deles! Nosso amigo Paulo Vasconcellos em breve vai nos dar mais detalhes num post ou no podcast - kkk estou prometendo por ele! Agora finalmente você vai poder tirar aquela ideia do papel! (em Português)

 LANÇAMENTO 🇧🇷 NO PRODUCT HUNT 

É muito raro vermos soluções Tech/Data made in Brazil por aí, não é mesmo? A Dadosfera, SaaS de Data/ML Platform está lançando HOJE no Product Hunt, maior comunidade de produtos digitais do mundo! No lançamento, você pode assistir uma demo mostrando como funciona a ferramenta, como ela implementa as melhores práticas de Data Management, tudo isso usando toda a facilidade de uso típica das ferramentas da Modern Data Stack. Bora ajudar o BR se destacar mais ainda no cenário de Dados no mundo?

(em Português)

VAGAS DA SEMANA

  • Experiência com SQL;

  • Conhecimento básico de Data Warehouse;

  • Entendimento de programação em Python ou Scala (scripting ou pipelines dados);

  • Conhecimento de ferramentas e práticas de SRE, como o Grafana e Prometheus;

  • Experiência com ambientes em cloud como GCP e AWS.

  • Saber programar é essencial. Sólido conhecimento em SQL e Python com aplicação de boas práticas de desenvolvimento;

  • Conhecimento básico de ferramentas de controle de versão de código e colaboração. Ex: Github, GitLab;

  • Conhecimento teórico em modelos de Machine Learning

  • Conhecimento básico do uso de serviços de Cloud; Containers / Docker;

MEME DA SEMANA

Meme da semana

Não tem muito como fugir, eu te garanto! kkk

DATA VISUALIZATION DA SEMANA

Recentemente, a notícia da falência do Silicon Valley Bank, um dos maiores bancos dos EUA e o maior financiador de Startups da Califórnia pegou muitos de surpresa. O user Pranshum do Reddit, que sempre posta no Data Is Beautiful, postou 2 visualizações interessantes sobre a quebra desses bancos nos últimos anos. Outra viz interessante - uma linha do tempo - você pode ver aqui. (em português)

PROXIMOS EVENTOS E MEETUPS

15 e 16 de março - 100% online e gratuito

20 a 23 de março - 100% online e gratuito

22 de março - 100% online e gratuito

23 de abril - 100% online e gratuito

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo