Kaggle: como vencer competições de Machine Learning

A startup de AI para moda que levantou 17 milhões de dolares  

Você é daqueles que gosta de competições de aprendizado de máquina e adoraria ter seu nome no ranking do Kaggle? No papo de hoje, conversamos com dois dos maiores participantes do Kaggle para nos contar sobre a carreira e como participar de competições. E, assim como um bom filme da Marvel, temos “cena pós-credito”! Ouça o episódio até o final para conferir.

E mais: como algoritmos sabem o que você vai digitar, como enganar câmeras treinadas com AI, e como passar no exame de certificação da Google Cloud. Vamos lá?

Nesse episódio, nós convidamos os Data Hackers

 — Lead Data Scientist na

Upwork 

— e

 — Ph.D e cofundador da

ImproveAndGo.com

 — para bater um papo sobre como eles começaram na área, quais ferramentas usam, como formam times, dentre muitas outras coisas. Tá imperdível!

O que está esperando? Corre para

! (em Português)

*Lembrando que você também pode ouvir nosso podcast no

,

,

,

ou no

 de sua preferência.

A Vue.ai é uma startup que está fazendo um trabalho bem legal ao utilizar AI na indústria da moda, e que acaba de levantar US$ 17 milhões como investimento. Um de seus principais produtos é uma aplicação que utiliza GANs para gerar poses. Funciona assim: o cliente manda a foto de seu produto (camisa, vestido, etc.) e a AI é encarregada de gerar imagens de modelos posando com o produto. Confira um pouco mais sobre eles nesse post. (em Inglês)

 

Pesquisadores da Universidade de KU Leuven mostraram como utilizar uma impressão foi capaz de enganar uma câmera treinada com computer vision. O mais interessante é que, esse experimento foi feito utilizando como algoritmo de teste o YoLo: uma biblioteca considerada estado da arte em detecção de objetos. O resultado, mostrado em vídeo, é impressionante. (em Inglês)

Em projetos de Machine Learning, um dos muitos desafios que são enfrentados é o desbalanceamento de dados. Isso acontece quando uma classe do seu dataset possui uma diferença númerica significativa em relação as outras classes (por exemplo, seu conjunto de dados possui muitas imagens de gatos, mas pouquissímas de cachorros). Nesse artigo, você não só conhecerá os conceitos por traz do balanceamento de dados, mas também como resolvê-los. (em inglês)

Nesse post do Daniel Bourke, ele diz como foi o processo dele para passar no exame de certificação de Engenharia de Dados do Google Cloud. Aqui, Daniel ensina a importância do exame e como você pode se preparar para ele sem gastar 3 anos de experiência na área. (em Inglês)

Criar data lakes é um dos maiores sonhos e desafios que as organizações estão enfrentando nos dias atuais. Para ajudar nessa tarefa, a Databricks, criadora do Apache Spark, está liberando a ferramenta Delta Lake, que oferece mais uma camada de storage para garantir integridade de dados e, consequentemente, deixar sua solução de data lake mais confiável. Confira um pouco mais sobre ela.  (em Inglês)

Aprendendo a aprender: poderosas ferramentas mentais para ajudá-lo no domínio de temas difíceisEmbora não seja um curso voltado para parte técnica, ele visa algo tão importante quanto: nossa capacidade de aprender coisas novas. Altamente recomendado pelos Data Hackers em nosso canal do Slack, vale muito a pena conferir esse conteúdo lecionado pela Dr. Barbara Oakley e Dr. Terrence Sejnowski. (em Inglês)

VAGAS DA SEMANA

  • Experiência como Data Engineer

  • SQL

  • ETL

  • AWS

  • Python ou similar

  • Superior completo

  • SQL

  • Estatística

  • Ferramentas de BI (Metabase, Superset, Power BI)

  • Google Analytics ou similares

Como algoritmos sabem o que você vai digitar?Já ficou curioso em saber como que o teclado de seu smartphone sabe qual palavra você vai usar em seguida naquela mensagem pro grupo da família? Nesse incrível artigo do The Pudding, eles explicam de forma interativa como esses algoritmos funcionam por debaixo dos panos. Vale muito a pena conhecer. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

29 de Abril de 2019

Hop n' Roll Brewpub - Curitba/PR - Grátis​

18 de Maio de 2019

Belo Horizonte/MG - Grátis

24 - 26 de junho de 2019

São Paulo/SP - A partir de R$ 494