GPT-3 e a tipologia do hype

Como fazer o deploy de um modelo com Flask e Heroku

Fala, Data Hackers! Bem-vindo de volta a newsletter mais completa de dados no Brasil. É muito provável que nos últimos dias você tenha ouvido falar sobre a GPT-3: uma AI criada pela OpenAI que está dando o que falar por seus feitos recentes. No destaque da news de hoje, você irá conhecer uma opinião que nos ajudará a processar e viver em meio a todo esse hype que está sendo feito.Além disso, nesta edição tem produtização de modelos; como o Shopify está resolvendo o desafio de Data Discovery; e como lidar com um dos maiores inimigos do Machine Learning.

 para que desenvolvedores pudessem brincar com o potencial do GPT-3, muitas coisas legais estão sendo exibidas na Internet. Tem gente que está criando sites, textos e até mesmo modelos de Machine Learning. Tudo isso tem gerado um

buzz

nas pessoas, em especiais as leigas, que não sabem dos desafios e até mesmo os potenciais que o GPT-3 tem. Para ajudar a processar todo esse

hype

, o pessoal da Page Street Labs criou esse artigo desmistificando o GPT-3, e como podemos lidar com todo esse

buzz

que acontece quando tecnologias emergentes recebem mais visibilidade. (em Inglês)

Servir modelos de Machine Learning são a opção perfeita para produtizá-los, e usar uma API geralmente é uma das mais atrativas abordagens. Uma opção bem interessante é usar o

framework

Flask para criar sua API e usar um serviço de cloud como o Heroku (que possui uma boa opção gratuita) para

hostear

a aplicação. Nesse post escrito pelo Data Hacker

, ele ensina como você pode ter sua aplicação pronta para uso em poucos minutos. (em Português)

 

Assim como muitas empresas gigantes do mercado, o Shopify tem um grande problema em armazenar e tornar útil a quantidade massiva de dados que gera. Nesse post, eles compartilham como criaram o Artifact: sua solução de Data Discovery que visa cuidar de toda a cadeia de aquisição, transformação e modelagem de dados. (em Inglês)

Modelos podem (e vão) falhar, e um dos maiores inimigos do Machine Learning é o Concept Drift  - Desvio de Conceito, em tradução livre -, que ocorre quando os dados que estão chegando no seu modelo possuem uma distribuição diferente daqueles em que ele foi treinado. Nesse artigo do HackerNoon, você irá conhecer um pouco mais sobre esse conceito, e como pode adaptar seu modelo para lidar com o

drift

. (em Inglês)

Nem sempre podemos esperar que alguma boa alma implemente aquele último paper na nossa linguagem preferida: você eventualmente precisará sujar as mãos e implementar por você mesmo. Mas, se assim como eu, você tem dificuldades em interpretar aquele LaTeX que parece um xingamento em grego, esse post pode ser útil pra você. Nesse post do Towards Data Science, você irá aprender a transformar um dos

papers

mais clássicos do mundo em código Python: o Generative Adversarial. (em Inglês)

Se você está usando Docker, é provável que além de ter seu ambiente isolado você também queira que sua aplicação escale e fique otimizada da melhor maneira possível. Mas você sabia que tem alguns pequenos ajustes que você pode fazer para deixar a performance dos seus containers melhor? Confira esse post para saber mais! (em Inglês)

VAGAS DA SEMANA

  • ETL

  • Modelagem dimensional

  • Tableau

  • Excelente comunicação

  • Mentoria de equipe

  • Experiência com Data Engineering

  • Experiência em liderança técnica

  • Excelente comunicação

  • Inglês intermediário

Continuando nossas dicas de conteúdos sobre o GPT-3, fica aqui a dica desse vídeo que o Diogo Cortiz lançou recentemente no canal do Youtube dele, onde ele explica detalhadamente os principais pontos do GPT-3. Vale muito a pena conferir. (em Português)

É possível visualizar o caminho da fama?Dos 100 vídeos mais visualizados do Youtube, 93 são vídeos musicais. É possível explicar o que causa efeitos como um artista ter poucos views no começo de sua trajetória e ter um boom de acessos? O pessoal do The Pudding analisou 138 artistas e tentam identificar um padrão na trajetória exponencial que tiveram. (em Inglês)

Tem alguma tirinha ou fun fact sobre dados? Envie no canal

#random

do

! E nada de levar as brincadeirinhas a sério hein!

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

24 e 25 de Agosto de 2020 - Evento online gratuito