Kaggle vai pagar US$ 30 mil pelo melhor storytelling

AlphaFold: como a DeepMind resolveu um problema de 50 anosd a Biologia usando AI

Fala, Data Hacker. Estamos de volta com mais uma newsletter! O destaque dessa edição vai para a pesquisa de 2020 do Kaggle, onde eles não só nos mostram o novo panorama de data science e machine learning no mundo, mas que também vai premiar a melhor história com nada mais de US$ 30 mil. Saiba mais abaixo.E mais: falaremos sobre como a DeepMind resolveu um problema de 50 anos da Biologia; o que está por trás da demissão de Timnit Gebru da Google; e a nova biblioteca do Prophet do Facebook.

Nem só de competições de Machine Learning é feito o Kaggle. Saiu recentemente a nova pesquisa anual deles sobre o mercado de DS e ML ao redor do mundo, e como já fizeram em outras edições, esse ano eles irão premiar a melhor história com os dados da pesquisa.Os storytellings serão avaliados em diferentes quesitos, como originalidade, a composição da história e documentação da solução, onde o vencedor irá embolsar 30 mil Bidens. E aí, quem vai participar? (em Inglês)

Uma das notícias mais comentadas na última semana foi o feito da DeepMind, que conseguiu resolver um problema de 50 anos, chamado de

, que tenta entender a estrutura 3D de uma proteína e, consequentemente, entender o que ela faz.

Uma das coisas que mais me chamaram a atenção foi o fato da solução utilizar mais ou menos o equivalente a 200 GPUs, uma quantidade, segundo a DeepMind, "modesta" em relação aos feitos anteriores. Queria ter essa modestia. (em Inglês)

 

A Google aparece de novo da nossa

news

, mas dessa vez em uma notícia ruim. 

é um dos maiores nomes quando o assunto é ética em AI, e ela criou e liderou um dos maiores times do mundo na Google, além de contribuir com diversos

papers

que salientaram os problemas de viéses e ética em algoritmos.

Nessa semana, Gebru compartilhou no Twitter a sua demissão pela Google, depois de tentativas de publicar um novo

paper

sobre os problemas que grandes modelos de linguagem como o BERT podem causar. O pessoal do MIT Technology Review teve acesso ao paper e mais sobre o caso, 

. (em Inglês)

Segundo a própria notífica, "Uma grave falha nos sistemas digitais do Ministério da Saúde levou à exposição dos dados pessoais de cerca de 243 milhões de brasileiros. A brecha foi encontrada no sistema de notificações da Covid-19, disponibilizado no primeiro semestre pelo governo, e permitia a consulta às informações de qualquer brasileiro cadastrado no SUS (Sistema Único de Saúde) ou que seja beneficiário de um plano de saúde no país." (em Português)

Provavelmente você já ouviu falar no

: uma biblioteca aberta em R e Python para previsão de séries temporais. Eu mesmo sou muito fã dela, sendo uma ótima opção para primeiros protótipos de modelos de previsão.

Contudo, a empresa do Markinhos Zuck divulgou recentemente uma nova biblioteca baseada no Prophet: a

, que utiliza muitas das APIs e comandos da já conhecida biblioteca, mas que agora possui suporte a redes neurais em PyTorch para calibrar as previsões. Com certeza vale a pena investir uma horinha pra testá-la. (em Inglês)

Não é só o Facebook que está avançando nas suas abordagens a problemas de previsão de série temporais.

, a Google demonstrou como está usando AutoML para resolver problemas de Time Series Forecasting. Segundo a publicação, a solução deles conseguiu atingir resultados impressionantes em competições de Machine Learning especializadas, como o M5 Forecasting, além de algumas outras competições do Kaggle, chegando a ficar entre os melhores 2,5% dos competidores. (em Inglês)

VAGAS DA SEMANA

  • +2 anos de experiência como Data Engineer

  • Modelagem de dados

  • Python

  • SQL

  • Inglês intermediário/avançado

  • Python

  • SQL

  • Ferramentas de BI (Metabase, Looker, Tableau)

  • Comunicação

  • Storytelling

Analistas deveriam aprender AI?Nesse novo vídeo da Cassie Kozyrkov, ela explica o quanto de AI um analista precisa saber. O segredo, segundo ela, é sempre imaginar o que te deixará mais ágil para criar análises poderosas em menos tempo. Separe 2 minutinhos do seu dia para ver esse vídeo, vale a pena. (em Inglês)

As empresas que mais cresceram durante a pandemiaUm dado interessante é sobre o Alibaba, que esse ano bateu um novo recorde no Dia dos Solteiros, faturando mais de R$ 302 bi. Se a visualização considerasse os dados de novembro, provavelmente estaria em uma posição mais alta ainda.

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito

8 de Dezembro - Evento online gratuito