O próximo desafio de dados não é dados

A FIFA vai testar AI para identificar impedimentos na Copa do Mundo A melhor forma de tomar decisões em dados que não usamos

Fala, Data Hacker, boas vindas a nossa newsletter!Essa semana marca a reta final da nossa pesquisa: o State of Data Brazil 2021! Além disso, a edição de hoje está repleta de conteúdos que imaginam o futuro e desafios da área, e nosso destaque vai para esse post do Locally Optimistic, onde Bryan Offutt destaca que o próximo grande desafio da área não vai ser ferramentas, mas sim organização.Além disso, nessa edição você vai conferir:

Última semana para responder o State of Data Brasil 2021!

Estamos chegando na reta final da pesquisa criada pelo Data Hackers + Bain & Company: o State of Data Brazil. Ainda dá tempo de participar dela. Se você ainda não respondeu, essa é a sua chance! Clique aqui para acessar a pesquisa.

Nos últimos anos tivemos um avanço incrível no tocante a descoberta e qualidade dos dados, e a como lidar com grandes bases. Contudo, pouco tem sido evoluido na questão organizacional, onde nós deveríamos trazer para o mundo de dados as melhores práticas já adotadas por engenharia de software, como testes, modularização, etc. Nesse artigo de Bryan Offutt, ele conta em mais detalhes os problemas organizacionais que enfrentamos atualmente e como vislumbra o futuro da área. (em Inglês)

A FIFA irá testar um sistema de identificação de posição irregular um ano antes da Copa do Mundo de futebol no Qatar. A AI será instalada nos seis estadios que vão sediar os jogos e será utilizado por arbitros de vídeo quando detectarem um impedimento. (em Português)

 

Hoje em dia, o simples trabalho de selecionar um restaurante para comer é feito orientado a dados. Você procura por lugares com bons reviews, vê se o tempo está bom, e até como o trânsito está. Segundo, Benn Stancil, deveríamos ter uma tomada de decisão semelhante no trabalho, onde ferramentas e o processo de decisão estariam mais próximos. Mas, segundo ele, não é isso que acontece. (em Inglês)

Recentemente testei (de forma bem cética) a biblioteca Spleeter da Deezer. Ela promete separar as faixas de voz e de sons de fundo, como músicas e ruídos. Eu fiquei muito impressionado pela facilidade de uso da ferramenta e sua acurácia. Vale muito a pena você testar e brincar com ela. (Em Inglês)

O Spacy é uma das mais completas ferramentas de NLP para Python, e com um excelente suporte em Português Brasileiro. Eles acabam de lançar um modelo de lemmatização baseado em Machine Learning, que aumentou a acurácia de lemmatização em PT-BR de 0.76 para 0.97. Um avanço muito importante para essa tarefa tão comum no processamento de linguagem natural (em Inglês)

Recentemente, o pessoal do Netflix liberou esse post falando um pouco mais sobre como eles avaliam testes A/B, focando especialmente em falso negativos e poder do teste. Eles ainda dão dicas sobre como melhorar seus próprios testes. Se tem alguém que manja de AB Testing, é a locadora vermelha! (em Inglês)

VAGAS DA SEMANA

  • Python

  • SQL e NoSQL

  • Cloud Computing

  • Exp. com ETL e ELT

  • Exp. com Linux

  • Exp. com IaC

  • Exp. com CI/CD

  • Python

  • Docker

  • Sistemas de orquestração (Airflow/Luigi)

  • Cloud computing

  • Machine Learning

[VoD] O mercado de dados em 2022: O que vai mudar?Se você perdeu a nossa live da semana passada, onde eu e Gabriel Lages falamos sobre o mercado de dados em 2022, e onde fizemos o sorteio do primeiro lote de adesivos do Data Hackers, aproveite para assistir agora! (em Português)

Igualdade

Muito legal essa visualização de grafos feita pelo pessoal do Visual Capitalist onde eles perguntaram a pessoas de 94 países o que é mais importante: família, lazer, trabalho, amigos ou religião. O grafo mostra quais países tem maior similaridade em valores. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

08 e 09 de Dezembro - Evento Gratuito e 100% Online

06 a 10 de Dezembro - Evento Gratuito e 100% Online

08 de Dezembro - Evento Gratuito e 100% Online