- Data Hackers Newsletter
- Posts
- GPT-4 sai na próxima semana e ele vai enxergar! 👀
GPT-4 sai na próxima semana e ele vai enxergar! 👀
Lançamento de Modern Data Stack made in 🇧🇷;Lançamento de Modern Data Stack made in 🇧🇷 ; IA da Hotmart te dá A DICA para criar seu próprio curso; Publicação dos dados do State of Data Brazil 2022;
Fala Data Hackers, sejam bem-vindos a mais essa news! Essa news tem um monte de lançamento: Tem a Hotmart com uma IA que vai te ajudar a criar um curso, tem os dados do State of Data que tão para ser liberados no Kaggle, tem a Dadosfera publicando seu produto no Product Hunt…
Porém, o destaque vai pro que o CTO da Microsoft Alemanha adiantou pra gente: o GPT-4 pode sair essa semana! Sim, o mais poderoso LLM do mundo vai ter uma nova versão, que é capaz de analisar até imagens!
Mas tem mais novidades legais nessa news, como:
O GPT 3.5 mal mal saiu do hype e a Open AI já, agora em conjunto com a gigante Microsoft, deve lançar seu sucessor, o GPT-4! E ele não vai só receber textos como inputs, ele vai “enxergar”: recebendo imagens para responder e também fine-tunning!
“Apresentaremos o GPT-4 na próxima semana, teremos modelos multimodais que oferecerão possibilidades completamente diferentes – por exemplo, vídeos”, disse Michael Braun, CTO da Microsoft Germany, em comentários divulgados pela mídia alemã Heise.
Um LLM multimodal é capaz de extrair informações de vários tipos de fontes. Isso pode abrir a possibilidade de ele retirar informações de vídeos e imagens que encontra na internet. O GPT-3.5, o atual LLM da OpenAI, é puramente baseado em texto.
Tá animado para ver o que o próximo modelo da Open AI é capaz de fazer? (em Inglês)
Imagina processar bilhões de registros por dia, petabytes de dados, que impactam toda a economia da América Latina? Sim, esse é o dia-a-dia dos profissionais de dados no gigante Itaú. Não só o grande volume impressionante de 26 petabytes de dados, mas o desafio de difundir o benefícios da análise de dados entre os mais de 7000 engenheiros de software e muitos mais profissionais da organização.
Nós do Data Hackers tivemos o prazer de trazer o Moisés Nascimento (Chief Data Officer), a Priscila Cardoso (Superintendente de Gestão de Dados) e o Roberto Figueira (Head de Engenharia da plataforma de Dados) para nos contar tudo sobre a Data Platform do Itaú.
Papo MUITO LEGAL, realmente imperdível! (em Português)
O DataBricks criou um e-book sobre boas práticas e conceitos de engenharia de dados e EM PORTUGUÊS para nos ajudar a evangelizar sobre essa jornada.
O ebook traz 8 casos de uso reais de aplicações em real-time, data lake, lakehouse, além de Cases de sucesso - claro que tinha que ter o jabá - de clientes que usam o DataBricks.
Mas tem várias referências de arquitetura e também definições que fogem do mundo da ferramenta, então vale a pena dar uma olhada! (em Português)
Como é de praxe, vamos liberar no Kaggle os dados da MAIOR PESQUISA sobre o mercado de trabalho em Dados do país!
Os dados já estão disponíveis no Kaggle.
Se prepare, pois logo logo vamos lançar a tão esperada competição State of Data Challenge, onde escolhemos e premiamos as análises mais pertinentes e bonitas sobre os dados!
Acesse, brinque com os dados e compartilhe com seus amigos! (em Português)
OUTROS TÓPICOS
Vazamento de dados, ou Data Leakage, é uma falha de processo que pode ACABAR com uma modelagem de Data Science. O vazamento ocorre quando informações que não deveriam estar disponíveis para o modelo estão presentes nos dados de treinamento. Neste post, a Data Hacker e Médica Letícia Alves nos ensina como usar a técnica SHAP para detectar e sanar esse problema. (em Português)
Ouvir/Ler sobre IA e Dados na mídia tradicional nem sempre é “instigante”, digamos… Mas essa reportagem do Correio Braziliense mandou bem demais! Com a participação de vários especialistas VERDADEIROS no assunto, como nosso amigo Leon Sólon do Let’s Data, a reportagem desmistifica o que tanto o pessoal vem falando do Chat GPT e do futuro dos empregos. (em Português)
A Hotmart criou uma IA - baseada no Open AI - que te ajuda a estruturar toda a ementa e lançamento de um curso na plataforma deles! Nosso amigo Paulo Vasconcellos em breve vai nos dar mais detalhes num post ou no podcast - kkk estou prometendo por ele! Agora finalmente você vai poder tirar aquela ideia do papel! (em Português)
LANÇAMENTO 🇧🇷 NO PRODUCT HUNT
É muito raro vermos soluções Tech/Data made in Brazil por aí, não é mesmo? A Dadosfera, SaaS de Data/ML Platform está lançando HOJE no Product Hunt, maior comunidade de produtos digitais do mundo! No lançamento, você pode assistir uma demo mostrando como funciona a ferramenta, como ela implementa as melhores práticas de Data Management, tudo isso usando toda a facilidade de uso típica das ferramentas da Modern Data Stack. Bora ajudar o BR se destacar mais ainda no cenário de Dados no mundo?
(em Português)
VAGAS DA SEMANA
Analytics Engineer II (Vaga Afirmativa para Mulheres)São Paulo - SP - Remoto
Experiência com SQL;
Conhecimento básico de Data Warehouse;
Entendimento de programação em Python ou Scala (scripting ou pipelines dados);
Conhecimento de ferramentas e práticas de SRE, como o Grafana e Prometheus;
Experiência com ambientes em cloud como GCP e AWS.
Pessoa Engenheira de Machine Learning II - Afirmativa para Afirmativa para Pessoas NegrasSão Paulo - SP - Remoto
Saber programar é essencial. Sólido conhecimento em SQL e Python com aplicação de boas práticas de desenvolvimento;
Conhecimento básico de ferramentas de controle de versão de código e colaboração. Ex: Github, GitLab;
Conhecimento teórico em modelos de Machine Learning
Conhecimento básico do uso de serviços de Cloud; Containers / Docker;
MEME DA SEMANA
Não tem muito como fugir, eu te garanto! kkk
DATA VISUALIZATION DA SEMANA
Recentemente, a notícia da falência do Silicon Valley Bank, um dos maiores bancos dos EUA e o maior financiador de Startups da Califórnia pegou muitos de surpresa. O user Pranshum do Reddit, que sempre posta no Data Is Beautiful, postou 2 visualizações interessantes sobre a quebra desses bancos nos últimos anos. Outra viz interessante - uma linha do tempo - você pode ver aqui. (em português)
PROXIMOS EVENTOS E MEETUPS
15 e 16 de março - 100% online e gratuito
20 a 23 de março - 100% online e gratuito
22 de março - 100% online e gratuito
23 de abril - 100% online e gratuito
Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.