Como saber se seu modelo de Machine Learning está funcionando mesmo

Machine Learning não é só Estatísticas! Por que todo Cientista de Dados deveria usar Dask?

Olá, Data Hacker! Seja bem-vindo a mais uma newsletter!Nossa comunidade não para de crescer. Somos mais de 600 membros em nosso Slack, enquanto nossa comunidade está chegando aos 2 mil Data Hackers. É muita felicidade para o nosso coração. Muito obrigado por fazer parte dessa história!Agora, chega de comoção! A gente sabe por que você está aqui: aprender. Então, vamos lá?

Nem sempre é possível confiar apenas no .score() do Python, não é? Existem outras métricas e formas de validar se seu modelo está realmente bom. Através de um post bem humorado, nosso co-fundador Paulo Vasconcellos explica como você pode ser mais assertivo na criação do seu modelo. (em Português)

 

Joe Davison, da Pluralsight, compartilha nesse post a sua opinião sobre o mercado taxar o termo Machine Learning como apenas mais um nome chique para Estatísticas (em Inglês).

Dask é uma poderosa biblioteca de processamento distribuído para Python. Com performance melhor que compilações em C, Dask torna-se um importante aliado para um código escalável nativamente (em Inglês).

Deep Learning se tornou o State of the Art em processamento de imagem, mas sabemos que a tecnologia ainda possui limitações e tem muito a melhorar. Contudo, vale lembrar que o Aprendizado Profundo "caiu no gosto popular" no último ano, e já está fazendo grande avanço. Confira nesse artigo quais são eles! (em Inglês)

Em parceria com a agência Grey, o Reclame Aqui lançou um aplicativo apartidário que ajudará qualquer cidadão a detectar políticos com denúncias e processos. Recebendo um prêmio no festival de Cannes na categoria Mobile, o aplicativo, que utiliza apenas a câmera do celular para detectar os políticos é uma excelente aplicação de Computer Vision e, quem sabe, Deep Learning.

Aprenda nesse curso do PluralSight os fundamentos básicos para você começar a criar seus projetos usando o framework Apache Spark. Trata-se de um curso curto e objetivo que deixará você apto para mergulhar fundo no mundo da computação distribuída.

VAGAS DA SEMANA

São Paulo/SP - Superior completo: Engenharias, Matemática, Estatística, Computação - Python - Machine Learning - Inglês

São Paulo/SP - SQL - MySQL - Oracle - DevOPS - Sistemas de alta criticidade

São Paulo/SP - Ensino Superior - Hadoop - Sqoop - HIVE - Spark - SQL

São Paulo/SP - Ensino superior - Ecossistema Hadoop - Streaming - ETL - Oracle - Teradata - Tableau - SAS

Battlefield V e dados no jogoOBattlefield V é um jogo de tiro que se passa durante a Segunda Guerra Mundial. Há alguns dias atrás, a DICE - empresa desenvolvedora do jogo - abriu sua fase alfa, onde jogadores poderiam testar o game e reportar a experiência. Como resultado, eles divulgaram esse estudo que mostra o que aprenderam, além de conceder excelentes visualizações.

PRÓXIMOS EVENTOS E MEETUPS

17/07 a 21/07/2018 - 9:00 as 19:00

São Paulo/SP - R$ 200 por trilha