O Data Hackers vai te levar para um evento de Machine Learning DE GRAÇA! 👉💵

O que faz o cientista de dados ser o profissional mais procurado pelos RHs?

Fala Data Hackers, chegamos a mais uma edição da sua Newsletter favorita!Para comemorar o fato de que a comunidade do slack do Data Hackers ultrapassou a barreira dos 4.000 participantes vamos fazer um sorteio de 5 ingressos gratuitos para o maior e mais completo evento de Machine Learning do Brasil o PAPIs - Real World Machine Learning Stories.Obs: Continue lendo essa newsletter para descobrir como participar.Além disso nessa edição da sua newsletter favorita vamos trazer vários conteúdos importantes esses são os destaques do dia:

  • Utilizando Data Science para entender se vale a pena ou não comprar um imóvel no Brasil  

  • Aprenda a Fazer Web Scrapping com R e dados do Governo

  • Entenda como funciona o Apache Nifi e otimize seu pipeline de dados

  • Descubra como a Tesla treina seus complexos modelos de Deep Learning

  • Veja a arquitetura utilizada pelo Walmart para gerenciar testes A/B em tempo real com Spark + Kafka

  • Conheça o Falcon SQL um SQL Client, robusto, versátil, bonito e gratuito

E tem mais: Dicas de eventos, podcast, ferramentas e vagas de emprego

Gilberto Titericz

, Kaggle Grandmaster e participante assíduo da comunidade Data Hackers (e ídolo de muitos participantes da comunidade)  foi destaque em um artigo da Startse. No artigo ele fala um pouco sobre sua carreira como cientista de dados e de como a maioria das empresas estão em busca desse profissional.

Link: 

Talvez você ainda não conheça o PAPIs, um evento de Machine Learning que acontece em alguns países, incluindo o Brasil. É um evento muito bem organizado e esse ano vai contar com palestras de grandes empresas como Uber, AWS, Nubank, Ifood, IBM, Stripe, Dafiti, Serasa, Alura e muito mais!

O evento esse ano vai ser em São Paulo no Cinemark Shopping Eldorado  e será dividido em 2 partes:

Dia 24/06 - Workshops

Dia 25/06 e 26/06 - 2 dias de conferência

Obs: Como o evento conta com participantes de todo o mundo, todas as palestras do evento são em inglês (nas últimas edições não tinha nem tradução simultânea)

O

Data Hackers

é parceiro do evento e em troca da parceria para divulgação conseguimos 5 ingressos gratuitos para a conferência (que vai rolar nos dias 25 e 26 de junho de 2019) e decidimos sortear para a comunidade.

Como vai funcionar o Sorteio?

O sorteio vai rolar no nosso

as 20:00 do dia 05/06/2019 (quarta) e vamos entrar em contato com os sorteados por email logo depois, fiquem atentos!

Observações importantes:

1 - O sorteio da direito apenas ao ingresso, os custos com estadia, locomoção, alimentação etc., são de responsabilidade dos participantes;

2 - O evento é 100% em

INGLÊS

, se você não tem facilidade em entender inglês será difícil tirar proveito máximo do mesmo;

3 - Só participe do sorteio se você realmente puder ir ao evento, como são apenas 5 ingressos, não podemos prejudicar os outros participantes da comunidade, ok?

Já pensou em utilizar Web Scraping para coletar automaticamente dados do governo disponíveis na internet e depois analisar essas informações? Foi isso que o Data Hacker Marcel Ribeiro Dantas fez e trouxe um passo a passo em seu

do nosso blog. Se você está curioso para aprender essas técnicas ou saber a que ponto a análise dos dados do presidente chegou, vale a pena conferir o

!

(em português)

 

data_science_imoveis_brasil

Muitos brasileiros tem dúvidas se vale a pena ou não comprar um imóvel, e sempre que pensamos nisso temos vários questionamentos:

- Vale a pena comprar ou alugar?

- O país está passando por uma bolha imobiliária?

- Vale a pena financiar? Usar o FGTS? 

O Data Hacker Anderson L. Amaral fez um artigo respondendo todas essas perguntas e para isso deu uma verdadeira aula de Data Science. Coletou dados da internet, fez diversos cruzamentos de dados, levantou hipóteses, testou diferentes análises e chegou a várias conclusões intrigantes. Que tal

dele e ver o resultado final? (em português)

Fazer um carro autônomo é um dos maiores desafios de IA atualmente, e a Tesla é sem dúvidas um dos principais players desse mercado. Nesse post eles mostram a complexidade de treinamento dos modelos de Deep Learning e detalharam os principais desafios encontrados.(em inglês)

Está precisando de uma solução para otimizar seu pipeline de dados? Vale a pena conhecer o Apache Nifi e entender como ele funciona nesse guia completo. (em inglês)

Já imaginou a complexidade de gerenciar testes A/B quando você trabalha com um grande volume de dados? Esse é justamente o problema que o Walmart enfrenta todos os dias com uma taxa de 1 a 3 milhões de registros por minuto. Nesse post da InfoQ eles mostram um pouco da arquitetura por trás de tudo isso. (em Inglês)

Que tal testar esse Client SQL open-source desenvolvido pela equipe da plotly?  Ele tem várias vantagens, como se conectar com várias bases de dados diferentes (incluindo bancos NoSQL), a possibilidade de criar gráficos já no client e exportar, além de ter um visual incrível.Faça o download nesse link e teste agora mesmo!Obs: Ótima dica do Data Hacker André Sionek

Adoramos o podcast hipsters.tech e adoramos ainda mais quando o assunto do episódio está relacionado diretamente a área de dados (pra quem não se lembra já participamos de um episódio).  No episódio da vez o time da Elo7 conta sobre as estratégias de migração de dados! (em português)

VAGAS DA SEMANA

Belo Horizonte - MG

  • Experiência em projetos de Data Science

  • SQL e Python

  • Conhecimento em modelagem estatística (GLM) e/ou modelos de Machine Learning

  • Conhecimento em ferramentas de BI ou Visualização de Dados (PowerBI, Tableau, Metabase ou Qlik)

  • Cursando, Graduação ou pós-graduação em um curso quantitativo 

  • Conhecimento básico em pelo menos uma linguagem de programação, preferencialmente R ou Python

  • Interesse por análise de dados e modelagem estatística, demonstrado por experiências profissionais, extracurriculares, ou projetos pessoais

Os Simpsons em Data VisualizationSem dúvidas Os Simpsons é um dos desenhos mais famosos de todos os tempos, chegando a 30 temporadas e com milhões de espectadores. Mas seria possível converter esse desenho para o mundo dos dados? Essa é a proposta desse artigo que explorou os dados de mais de 600 episódios e transformou em Dataviz.(em inglês)

PRÓXIMOS EVENTOS E MEETUPS

04 de Junho de 2019

Cefet Contagem - Contagem/MG - Grátis

06 de Junho de 2019

EVOA Accelerator - Maringá/PR - Grátis

Obs: Lista de espera

24 - 26 de junho de 2019

São Paulo/SP - A partir de R$ 494

*Obs: Esse valor é com o 

 para os Data Hackers!

Lembrando que vamos fazer um