- Data Hackers Newsletter
- Posts
- Modelo de brasileiro na frente do Google! 🇧🇷
Modelo de brasileiro na frente do Google! 🇧🇷
Modelo de brasileiro na frente do Google!
Fala Data Hackers! Tudo bom com vocês?!
Essa semana foi beeem especial para nós brasileiros. Pela primeira vez na história, um modelo feito por um cientista BR fica no primeiro lugar desse ranking de mais baixados. Ficou na frente até mesmo do BERT Base Model, desenvolvido pela Google!
Nós que já figuramos diversas vezes no topo do Ranking do Kaggle, ocupamos agora também o espaço em outra comunidade ultra-relevante no mundo de dados, o Hugging Face.
Nessa news trouxemos outros conteúdos bem legais feitos por brazucas lá no nosso blog. Depois de ler a news, corre lá pra conferir mais conteúdo em pt-br de altíssima qualidade!
Mas não é só isso! Tem mais:
Jobs, eventos massa e o meme da semana!
Chegamos na etapa final do State of Data Brazil 2022, a maior pesquisa sobre Dados & Machine Learning do Brasil. Talvez, a mais esperada por vocês: o nosso Challenge!
Nessa competição, incentivamos toda a comunidade a obter os dados disponibilizados gratuitamente pelo Data Hackers e Bain & Company Brasil e fazer suas análises. Pode construir modelo de ML, pode fazer gráficos bonitos de colocar no quadro, pode tudo para impressionar os jurados da competição e entregar real valor para a comunidade brasileira de Data!
E como sempre, além de uma oportunidade de colocar seus conhecimentos de Data Storytelling em prática, vai concorrer a prêmios muito bacanas! Ainda não vou falar nada porque você vai saber tudo na nossa Live de lançamento no YouTube!
Já ativa o sininho para receber a notificação quando o evento começar!
Você também vai poder acompanhar nossa live no YouTube ou LinkedIn. (em Português)
Um dos temas mais relevantes da década atual é como garantir que modelos de ML e IA não reproduzam as discriminações e injustiças estruturais da sociedade.
O Data Hacker Kleyton da Costa, pesquisador da PUC-Rio e Cientista de Dados na Holistic AI, escreveu este post incrível para nosso blog, onde explica como utilizar Python para mitigar esses riscos.
Kleyton explica quais os principais fatores para aplicar a “Responsible AI" e, do lado prático, mostra como utilizar o Bias Mitigation da lib Holistic AI para mitigar os viéses do modelo no Adult Dataset.
Realmente, é um post mais que necessário para todo mundo que está criando ou tunando AIs que analisam faces e corpos humanos. (em Português)
Essa é de nos encher de orgulho! O cientista brasileiro Jonatas Grosman atingiu o primeiro lugar no ranking de modelos mais baixados do Hugging Face, na frente até do BERT da Google! O feito, muito celebrado nas redes sociais, é um dos que mostram o potencial que o Brasil tem de alcançar destaque internacional na área de Data/ML/AI.
O modelo do Jonatas é um fine-tunning do modelo Wav2Vec2-XLSR-53 do Facebook, que faz reconhecimento de fala em inglês.
Além do modelo no Hugging Face, você pode acompanhar o trabalho do Jonatas em seu github, onde está desenvolvendo o Hugging Sound: um toolkit para manipular e treinar modelos de reconhecimento de fala usando o Hugging Face como interface. Deixa sua estrela! (em Inglês)
OUTROS TÓPICOS
O Amazon Mechanical Turk é uma ferramenta que utiliza tasks simples de labelling e distribui para um grupo de pessoas - humanos reais - ajudarem a rotular informações que podem ser utilizadas no treinamento de modelos.
Mas a AWS está colocando uma AI para ajudar os humanos Sim! É o que a Tech Crunch trouxe
(em Inglês)
Depois de sua maior concorrente bater 1 trilhão de dólares em valuation, a AMD fez um showcase mostrando que não vai ficar para trás no boom da AI - e consequente, das GPUs - no mercado atual. Esse post mostra todas as estratégias da empresa pra abocanhar essa demanda gigante do mercado. (em Português)
Elementl é uma Plataforma SaaS que compete com o Apache Airflow (na real, com outras soluções gerenciadas de Airflow, como o Astronomer ou o Google Composer), mas é baseada em Dagster. Ela acaba de receber USD 33 milhões de investimento, deixando mais acirrada ainda essa disputa. (em Inglês)
O Data Hacker Gustavo Bruschi, em mais nova contribuição para nosso blog, faz um tutorial prático de Previsões Conformes (Conformal Predictions) para quantificar incertezas em modelos de Classificação Binária.
PS: Creio que essa deve ter sido a melhor capa de todos os tempos do nosso blog! kkkk (em Português)
VAGAS DA SEMANA
Trainee em Eng. de Soluções de Dados - DadosferaRemoto - Brasil
Formado em áreas de Exatas ou Engenharia. (até dois anos da data de formatura)
Conhecimento em Estatística e Machine Learning ;
Conhecimento em Visualização de Dados;
Conhecimento nas linguagens Python e SQL;
Conhecimentos em Linux, Cloud e Metodologias Ágeis são um plus;
Inglês Avançado;
São Paulo - SP (Remoto)
Ensino Superior Completo; Criação de controles e score de qualidade;
Experiência nas estratégias para disseminar a cultura de governança para a empresa;
Conhecimento em ferramentas de suporte à Governança de Dados, como Catálogo de Dados;
Experiência na condução de treinamentos e capacitações;
Experiência com documentações do ciclo de vida dos dados;
Conhecimentos sobre a LGPD e Compliance em Privacidade
MEME DA SEMANA
Rapaiz… Essa semana foi uma suadera. Pra quem não tá ligado. 😰
DATA VISUALIZATION DA SEMANA
De novo os mitos do Visual Capitalist estã aqui. Eles postaram em seu instagram essa visualização mostrando os sites mais visualizados do mundo. Incrivelmente, Yahoo ainda figura na lista, com mais de 4 Bilhões de views, se considerarmos sua presença no Japão também. Outra coisa que impressiona é o levante do Bing e do próprio ChatGPT! (em Inglês)
PROXIMOS EVENTOS E MEETUPS
Imersão Alura IA19 a 23 de junho - 100% online e gratuito
26 a 29 de junho - (Dia 28 trilha exclusiva de Dados + AI)
*Obs: Os fundadores da comunidade Data Hackers estarão ao vivo no dia 28/07 (Cupom de desconto de 15% para participantes da comunidade: DATAHACKERS15)
DBA Brasil Data & Cloud 202324 de jun de 2023 às 08:30 até 18:00 - Gratuito
Data Makers Fest (Porto - Portugal)23 e 24 de Outubro de 2023
29 de junho de 2023 - 09h00 às 10h30 (BRT) - Gratuito
Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link
Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.
Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.