O Data Hackers vai te dar um Playstation 5! 🎮

Tenha acesso a uma lista com estratégias passo a passo para fazer seleção de features nos seus modelos

Fala Data Hackers, hoje é dia de um importante anúncio:Já foi dada a largada para o Challenge da pesquisa State of Data Brazil 2021, uma competição que vai dar prêmios de peso para as melhores análises dos dados da pesquisa. Ainda não acredita? Veja só os prêmios:

  • 1º Lugar: 1 Console PlayStation 5

  • 2º Lugar: 1 Oculus Quest 2 VR Headset

  • 3º Lugar: 1 ASUS Monitor portátil ZenScreen de 15,6 polegadas 1080P

Fique atento ao restante da newsletter para entender como participar e concorrer a esses prêmios.

Além disso temos vários outros assuntos quentes no mundo dos dados para atualizar sua semana:

2022 está sendo um grande ano para a comunidade Data Hackers!Depois de todo o sucesso da pesquisa State of Data Brazil, temos orgulho de anunciar o Challenge, uma competição que vai premiar as melhores análises feitas com base nos dados da pesquisa.É uma ótima oportunidade de explorar os dados do mercado de trabalho em data no Brasil, melhorar seu portfólio de análises e ainda concorrer a prêmios incríveis como um PS5, um Oculus Quest 2 e um monitor portátil de alta resolução. Além desses prêmios, os 10 notebooks com mais upvotes no kaggle da pesquisa State of Data vão ganhar um kit com uma camiseta da comunidade Data Hackers.As regras para participação na pesquisa podem ser acessadas nesse link.A competição vai ficar no ar até o dia 12/07/2022 e a banca avaliadora vai contar com alguns dos maiores especialistas brasileiros na área de dados, que vai avaliar as análises de acordo com os seguintes critérios:

  • Relevância das análises apresentadas

  • Qualidade das visualizações

  • Originalidade das análises

  • Documentação e legibilidade do código

Não deixe de fazer parte desse desafio e concorrer aos prêmios e não se esqueça de compartilhar com os amigos!Acesse o site: stateofdata.com.br/challenge(em Português)

Inspirado no índice Big Mac (que já foi assunto dessa newsletter), a prefeitura do Rio de Janeiro desenvolveu um índice que é a cara do carioca: Índice Frangão Carioca. Por meio do levantamento feito por aplicativo de entrega, a pesquisa analisou os preços dos frangos, com farofa e batata, em 160 bairros diferentes.Além de criativo, o indicador frangão é uma forma de entender em parte o consumo no Rio. Os dados apresentados pela pesquisa mostram a disparidade econômica presente na cidade e sua implicação no consumo do frangão, um alimento tão presente na vida do carioca. (em Português)

Um dos grandes desafios para as soluções de recomendação e busca de plataformas está na qualidade dos meta-dados. Como esse tipo de serviço engloba uma variedade muito grande de usuários e produtos é muito difícil modelar os sistemas de forma que todo o volume de informações fique bem catalogado e organizado, tornando ainda mais difícil a vida de engenheiros e cientistas que precisam otimizar os sistemas de busca e recomendação de produtos.

Diante desse desafio a equipe do Ifood resolveu utilizar técnicas de NLP para que a própria descrição textual dos menus pudesse servir de input para os metadados dos produtos de forma automatizada.

Nesse post eles contam em detalhes todo esse processo. (em Inglês)

 

O GPT-3 é sem dúvida nenhuma um dos algoritmos de maior destaque no atual cenário da inteligência artificial aplicada a solução de problemas comuns. Anunciado em 2020 pela OpenAI o algoritmo impressionou o mundo com sua capacidade de imitar textos escritos por humanos com realismo incomum para máquinas.

Porém após 2 anos, o mercado já começa a criar uma certa expectativa em relação a seu sucessor o GPT-4, que está prestes a sair do forno.

Nesse artigo, uma das mentes brilhantes por trás do GPT-4 da detalhes sobre as principais diferenças entre os modelos e o que poderemos esperar desse novo e robusto modelo. (em Inglês)

Veja o que as empresas de maior destaque na área de dados no Brasil estão fazendo para atrair e reter profissionais Na última semana tivemos uma live muito interessante com pessoas que estão a frente de times de dados em empresas de destaque no Brasil como Nubank, Hotmart, Bain & Company e Magalu, e o assunto foi: "Como atrair e reter talentos de dados no Brasil". No bate papo os convidados mostraram em detalhes os desafios de cada uma das empresas nesse tema, compartilhando curiosidades, dicas e estratégias que eles tem utilizado para encarar esse cenário.  (em Português)

Conheça as melhores plataformas de hospedagem gratuitas para implementar seus projetos de Machine Learning em produção. (em Inglês)

Cansado de ficar horas preso no trânsito? Fique tranquilo que já existe um projeto de IA que promete utilizar a inteligência dos sinais de trânsito e fluxo de veículos para acabar com os problemas de engarrafamento e excesso de fluxos em grandes vias. (em Inglês)

Um dos grandes desafios para quem desenvolve modelos de Machine Learning é a etapa de Feature Selection, pensando nisso esse artigo trás uma série de estratégias organizadas para facilitar esse processo. (em Inglês)

Não basta ser um bom analista, é necessário gerar valor para as empresas. Isso pode parecer óbvio mas a grande maioria das pessoas que trabalham na área de dados nunca sequer pararam para pensar nisso. (em Inglês)

Quase todo mundo que trabalha na área de dados um dia acabará enfrentando o problema de ter modelos tão complexos que já não caberão na memória da máquina, levando uma eternidade para serem treinados. A boa notícia é que já existe uma maneira melhor de lidar com esse desafio, utilizando um conceito chamado de paralelismo de dados. Esse artigo mostra em detalhes como enfrentar e superar esse tipo de desafio. (Em Inglês)

Conheça o Promobit a maior comunidade de ofertas do BrasilQuantas vezes você já comprou algo e viu que estava mais barato em outro lugar?Se você está em busca daquela sua placa de vídeo nova pra rodar seus modelos, quer saber quando aquele livro que você está namorando há tempos entrar em promoção, ou simplesmente quer pagar menos em um produto que está de olho, você precisa conhecer o Promobit: a maior comunidade de ofertas no Brasil!Eles contam com mais de 900 ofertas atualizadas diariamente pra você aproveitar, além de ter uma forte comunidade de pessoas que comentam e dão dicas sobre como aproveitar as melhores promoções. Você ainda pode montar sua lista de desejos para ser notificado quando um produto entrar em promoção. Baixe o app e instale para começar a aproveitar!  (em Português)

VAGAS DA SEMANA

  • Lidar bem com números, tendo capacidade analítica excelente;

  • Experiência com UX Design e condução de seus processos;

  • Rigor na análise de resultados e na documentação da área;

  • Conhecimento em SQL, Análise Exploratória de Dados, Python / R;

  • Sólida experiência em engenharia de dados;

  • Conhecimento em arquitetura de Data Lakes e pipelines de dados;

  • Conhecimentos em CI/CD;

  • DataOps/MLOps;

Estudar estatística? Matemática? Cara vai por mim eu sei como rodar modelos de Machine Learning em poucos cliques...

Não é novidade pra ninguém que o Brasil vive um dos piores momentos inflacionários das últimas décadas, mas já parou para pensar em quais os itens que tem sofrido maior impacto de mudança dos preços? Seriam os combustíveis os maiores vilões ou os alimentos? Nessa análise feita pela equipe do Nexo Jornal é possível entender em mais detalhes esse movimento. (em Português)

Meetup - Arquitetura e processamento de dados25 de Maio - Evento Gratuito e 100% OnlineTDC - Innovation01 a 03 de Junho - Evento Gratuito e 100% OnlineWomen in Data Science Recife04 de Junho - Evento Gratuito e 100% OnlineObs: Call for papers já está abertoData + AI Summit27 a 30 de Junho - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso.