Não deixe a treta morreeer... 🎵 🎶

Agrupamento com Machine Learning em Python

Olá, Data Hacker! Seja bem-vindo a mais uma news! Hoje, como era de se esperar, o DH não vai deixar passar mais uma polêmica passar ilesa.Agora, envolvendo uma das maiores estrelas da comunidade de Data Science e IA do mundo, o youtuber Siraj Raval. Toda a comunidade ficou chocada ao ver que Siraj está diretamente envolvido em mais um caso de plágio na área.Mas vamos falar de coisa boa... Na news também trouxemos um projeto open-source pra você seguir e se inspirar; dicas pra construir um DW, tutoriais de ML usando Python; vagas de emprego e muito mais! Se liga aí!

Há pouco tempo atrás, levantamos várias "tretas" no nosso episódio mais polêmico do podcast. Infelizmente, aparece novamente um caso plágio e pouca consideração com os alunos em um curso de Data Science, agora envolvendo um dos astros da área no mundo: o youtuber Siraj Raval.  Como mostra a reportagem do The Register, após o lançamento recente de seu curso online de Machine Learning, Siraj tem sido acusado de copiar trechos de códigos de modelos no Github e não dar os devidos créditos aos produtores. Como se não bastasse, também há diversas reclamações de alunos que pediram o reembolso do curso, mas foram simplesmente ignorados.Novamente, mais um acontecimento pra entristecer a comunidade de dados pelo mundo :((em inglês)

O Data Hacker Cássio Giehl lançou o terceiro post de uma série sobre o início de seus estudos de Aprendizado de Máquina, usando Python, agora falando sobre Agrupamento. Com um texto breve, Cassio mostra como usar KMeans para fazer Clustering no Iris Dataset. Ótimo tutorial pra quem está começando a estudar ML reproduzir o passo a passo.

(em Português)

 

Ao fim do mês de conscientização sobre o suicídio no mundo, trazemos uma análise muito importante. O Data Hacker

, Cientista de Dados na Força Aérea Brasileira, usou um dataset disponível no Kaggle pra mostrar que o suicídio, que mata mais que a AIDS e alguns tipos de câncer, está subindo no Brasil. Outras conclusões muito relevantes são feitas nesse estudo incrível do Carlos. Não deixe de ler, conscientize-se! (em Português)

Olha que projeto legal: o Data Hacker Lucas Oliveira fez um modelo que identifica plantas doentes analisando fotos de folhas com Deep Learning! O projeto está disponível no Github e pode ser facilmente replicado utilizando Docker. Um exemplo incrível pra quem tá buscando criar um portifólio relevante em Ciência de Dados.

A Claire Carroll, Community Manager do incrível

, compilou 5 dicas sensacionais pra quem está construindo um DW. Organização dos schemas, boas práticas de nomenclatura e definições de privilégios são algumas das dicas essenciais desse post de quem entende muito bem do assunto. (em inglês)

O que Geometria tem a ver com Palavras e os sentidos delas? Não sabe? Então você tem que ler esse texto do Daniel Dominguete. Com um artigo completo e didático, Daniel conta como várias técnicas de NLP utilizam-se da representação espacial de palavras pra ver similaridades de sentidos e até entender como uma mudança no sentido (de feminino pra masculino, por exemplo) pode ser traduzido em um deslocamento espacial. Incrível! (em português)

Dica do Data Hacker Gabriel Rosalindo no

, esse é uma wiki que traz vários conceitos muito importantes sobre Engenharia e Ciência de Dados. Dos algoritmos mais usados em Machine Learning aos cargos mais comuns nesse novo mundo, o guia é um ótima introdução à area pra quem quer entender mais sobre Data Science & Engineering. Aprenda sobre Ciclo de Vida, Dados estruturados e desestruturados, Data Lakes e DWs e mais! (em Inglês)

3 Livros sobre Data Science GRATUITOS pra Kindle (LINKS ABAIXO)Dica do nosso Community Manager Marlesson Santana no nosso Slack, segue abaixo uma lista de 3 livros introdutórios, sobre Estatística, Análise de Dados e Python GRATUITOS para quem tem Kindle:

(em Inglês)

VAGAS DA SEMANA

  • Python, BigQuery, SQL;

  • Data Lakes/DW;

  • Boas práticas de programação

  • ETL;

  • Python;

  • Superior em matemática, engenharia, ciências da computação ou áreas correlatas;

  • Desejável conhecimento em Python ou R;

  • Técnicas de Machine Learning;

  • Desejável domínio em cloud.

A dominação do Uber na cidade de Nova IorqueMais um post sensacional no Reddit mais lindo do mundo (/r/dataisbeautiful): Um gráfico dinâmico mostrando como Uber ultrapassou os clássicos Taxis Amarelos da Big Apple. Alguém aí vai de taxi?! (em inglês)

PRÓXIMOS EVENTOS E MEETUPS

05 de Outubro de 2019

São Paulo/SP - Gratuito - Fila de Espera

01 de outubro de 2019

Stoodi - São Paulo/SP - Gratuito

15 de outubro de 2019

São Paulo/SP - Gratuito

18 - 20 de novembro de 2019

UFBA - Salvador/BA