- Data Hackers Newsletter
- Posts
- Machine learning com Gzip 🗜️
Machine learning com Gzip 🗜️
Que ano, hein? E ainda estamos em Julho
Fala, Data Hackers. Seja bem-vindo a mais uma newsletter! Essa semana foi mais agitada que boneco de posto, com muitos anuncios desde empresas sendo compradas até modelos de machine learning sendo treinados com Gzip. E para não ficar de fora de nenhuma novidade, nada melhor que começar a semana com a newsletter da sua comunidade favorita, não é mesmo?
Se liga no que você vai conferir nessa edição:
Está no ar o Challenge 2023 - State of Data, a competição que vai premiar as melhores análises da pesquisa State of Data, conduzida pelo Data Hackers e Bain & Company. Semana passada fizemos uma live de lançamento do desafio (que você pode conferir a gravação aqui) já dando algumas dicas para mandar bem.
Para participar do Challenge e concorrer a prêmios como Playstation 5, Drone DJI e um Kindle Paperwhite, é preciso se inscrever nesse formulário. Além disso, confira esse post no Kaggle dando maiores detalhes sobre as regras da competição.
Você também pode conferir entrevistas que fizemos com os vencedores do ano passado, como esse papo com o Luis Simões, que deu dicas excelentes! (em Português)
O paper que mexeu com a comunidade no Twitter essa semana foi um feito muito curioso: pesquisadores criaram um modelo de classificador de texto usando as arquiteturas mais complexas de machine learning existente (incluindo o Transformers, arquitetura por trás dos modelos GPT) e comparou seus resultados com um modelo treinado com… Gzip. Sim, Gzip, o compactador de arquivos.
Os pesquisadores utilizaram um algoritmo de KNN e o treinaram em embedding gerado pelo Gzip. O resultado é um impressionante modelo que bateu até as redes neurais mais modernas. (em Inglês)
O Google lançou no Brasil o Bard, uma ferramenta de inteligência artificial que funciona como o ChatGPT. O Bard está disponível gratuitamente em 40 idiomas, incluindo o português, e pode criar roteiros turísticos, escrever textos em vários formatos e sugerir códigos de programação, entre outras funções. Agora podemos contar com mais uma opção para nos ajudar com tarefas e respostas rápidas! (Em Português)
O Data Hacker Fabiano Castello utilizou o Code Intepreter da OpenAI (ferramenta de geração de código) para criar análises nos dados do State of Data Brazil. Confira o resultado desse trabalho! (em Português)
OUTROS TÓPICOS
Digital Ocean compra a Paperspace por US$ 111 miA Digital Ocean adquiriu a startup de computação em nuvem Paperspace por US$ 111 milhões em dinheiro. Com essa aquisição, a Digital Ocean poderá oferecer aos clientes ferramentas e infraestrutura para testar, desenvolver e implantar aplicativos de IA com mais facilidade. Os clientes da Paperspace também se beneficiarão dos serviços em nuvem da Digital Ocean, incluindo bancos de dados, armazenamento, hospedagem de aplicativos e suporte. (Em Inglês)
Falha de segurança no HuggingFace pode permitir criação de modelos que geram desinformaçãoO pessoal da Mithril Security mostrou como é possível modificar um modelo de linguagem de grande escala (LLM) de código aberto, o GPT-J-6B, para disseminar desinformação enquanto passa despercebido pelos benchmarks padrão. (Em Inglês)O que há de novo no Delta Lake 3.0O Delta Lake, uma camada de armazenamento otimizada para dados e tabelas na plataforma Databricks Lakehouse, chegou a sua versão 3.0. Com recursos como transações ACID, metadados escaláveis e viagem no tempo, o Delta Lake é uma ferramenta versátil para gerenciar grandes volumes de dados. Descubra como as atualizações do Delta Lake 3.0 abordaram os desafios da versão anterior. (Em Inglês)
DICA DE VÍDEO
Amanhã, terça-feira ás 20h, nós temos um encontro marcado no Youtube, onde vamos conversar com a Hayala Cavenague, que ano passado tirou o segundo lugar no Challenge do State of Data Brazil. Ela vai contar como foi sua experiência e dar dicas de como se dar bem na competição. Não perca! (em Português)
VAGAS DA SEMANA
Data Governance Engineer - EBANXCuritiba, Paraná, Brazil
EXP com Data Governance;
Python ou Scale;
Conhecimento em AWS;
SQL e databases;
Tableau e Metabase.
Analista de Produtos de Dados - CieloCampinas, São Paulo
Modelagem de dados;
Machine Learning;
SQL;
Python;
Visualização de dados (Power BI/Tableau).
MEME DA SEMANA
DATA VISUALIZATION DA SEMANA
Recentemente a Meta lançou o Threads, seu aplicativo para rivalizar com o Twitter. O aplicativo demourou apenas 5 dias para bater 100 milhões de usuários, batendo o recorde anterior do ChatGPT. Mas, e quanto a outros aplicativos e redes sociais? Você sabe quanto tempo eles demoraram para atingir a mesma marca? (em Inglês)
PRÓXIMOS EVENTOS
Data Mesh na Prática com Dadosfera17/07/2023 a 21/07/2023, das 19:00 às 22:00 - Online
Desconto de 50% Cupom DATAHACKERS50
Supletivo DH - Tableau25/07 às 19:00 - Online e Gratuito
Data Makers Fest (Porto - Portugal)23 e 24 de Outubro de 2023
Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link
Copyright © datahackers.com.br.Want to change how you receive these emails?You can update your preferences or unsubscribe from this list.