Ultralearning Data Science: Como aprender DS e ML de forma rápida e eficiente 😎

Utilizando análise de dados para entender a evasão escolar no Brasil

Olá, Data Hacker! Sabia que já ultrapassamos as 100 edições dessa newsletter?Fica aqui o nosso "muito obrigado!" por estar acompanhando nosso trabalho e nos ajudando a seguir com essa iniciativa. Mas agora vamos ao que interessa: os conteúdos da semana estão incríveis!Você já conhece o conceito de ultralearning? Essa é uma metodologia focada em acelerar o aprendizado, principalmente no que diz respeito a conteúdos complexos. O primeiro post que trouxemos hoje é exatamente sobre esse tema. Benedict Neo (um maluco da Malásia) estava estudando essa metodologia e encontrou a adaptação perfeita para um dos problemas mais recorrentes em Data Science e Machine Learning. Afinal, quase todo mundo se pergunta: "Como aprender tantos conhecimentos de maneira contínua para conseguir acompanhar as evoluções da área de Data Science?".Além disso vamos falar sobre com podemos utilizar técnicas de análise de dados para analisar a evasão escolar no Brasil, e como o Data Science pode ser utilizado para responder perguntas inusitadas como "Qual o participante de Porta dos Fundos ainda consegue um bom engajamento da audiência e qual não consegue mais?". Mas não é só isso, vamos dar dicas de boas práticas em SQL que podem deixar seu dia a dia mais positivo, vamos mostrar um guia passo a passo para fazer uma boa análise exploratória e listar quais foram as pesquisas em ML e NLP de maior destaque ao longo de 2019. No fim ainda separamos algumas vagas de emprego e dicas de eventos que vão acontecer ainda esse mês.E aí, prontos para mais uma edição da sua newsletter preferida?

Todos os dias diversas pessoas nos procuram com dúvidas sobre como aprender Data Science. Alguns pedem dicas de cursos, outros pedem dicas de livros, mas o mais normal é vermos pessoas completamente perdidas, se assustando com o volume de conhecimento necessário para enfrentar os desafios da área.Para tentar ajudar a todos que não sabem por onde começar, e aproveitar para dar um empurrãozinho para aqueles que querem acelerar sua busca por aprendizados, trouxemos uma metodologia que promete solucionar exatamente esse tipo de problema. E o nome dela é Ultralearning.Em uma série de posts o autor propõe uma adaptação da metodologia para ser utilizada exclusivamente no aprendizado de Data Science e Machine Learning, explicando detalhadamente cada passo.(em Inglês).

Um desafio complexo para todo programa de humor é conseguir se reinventar e manter a atenção da audiência ao longo do tempo. Com o canal porta dos fundos não tem sido diferente, e seus números de audiência vem caindo nos últimos anos. A galera do Curso-r resolveu utilizar Data Science para ir mais a fundo nessa história e investigar quais os participantes do Porta dos Fundos estão conseguindo reverter esse cenário.  (em Português)

 

O Data Hacker Gustavo Alexandre resolveu utilizar seus conhecimentos em Data Mining para analisar um dos problemas mais sérios relacionados a educação no Brasil, a evasão escolar. Nesse post ele apresenta o conceito de Educational Data Mining e mostra como os dados são importantes para buscarmos uma solução para um problema tão crítico para o futuro do país. (em Português)

Neste guia você vai conseguir aprender os passos essenciais para desenvolver uma boa análise exploratória dos seus dados antes de partir para a construção de modelos de Machine Learning. (em Inglês)

O ano de 2019 foi excelente para a área de dados e trouxe muita inovação envolvendo ferramentas, técnicas e métodos. Nesse post você vai poder conferir 10 publicações de grande destaque envolvendo Machine Learning e NLP. (em Inglês)

Já pensou que grande parte dos problemas de performance que você enfrenta nos seus projetos de dados poderiam ser solucionados com boas práticas de SQL? Nesse post são apresentados 12 erros cometidos constantemente por programadores e como a correção deles pode aumentar o desempenho das consultas. (em Inglês)

VAGAS DA SEMANA

  • Conhecimento em Machine Learning e validação de modelos;

  • Conhecimento dos principais pacotes de análise de dados e machine learning (como Pandas, NumPy, Matplotlib, Sklearn);

  • Programação para Data Science (Python, R);

  • Banco de Dados (SQL);

  • Ferramentas de controle de versionamento (Git).

  • Experiência com o desenvolvimento de modelos de Machine Learning

  • Conhecimentos em SQL e Python (de preferência com bibliotecas de machine learning);

Ultralearning: Accelerate Your Career, Master Hard Skills and Outsmart the CompetitionAcompanhando o principal post da newsletter de hoje resolvemos indicar o livro Ultralearning. Uma metodologia para acelerar o aprendizado de conhecimentos complexos. O objetivo do livro é propor um framework para ajudar o leitor a aumentar a eficiência do aprendizado.  (em Inglês)

Utilizando Data Visualization para analisaras musicas mais tocadas no Spotify da HolandaEsse maluco resolveu extrair centenas de milhares de dados sobre as músicas mais tocadas no Spotify da Holanda e fez uma análise completa de como a popularidade dos gêneros musicais do país vem mudando ao longo do tempo. O resultado da análise foi uma visualização de dados que ficou tão bonita que pode até virar uma obra de arte! (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

14 de Janeiro de 2020

Datalab Serasa Experian - São Paulo/SP - Gratuito

16 de Janeiro de 2020

Kunumi - Belo Horizonte/MG - Gratuito

16 de Janeiro de 2020

Espaço Nuvem - Rio de Janeiro/RJ

18 e 19 de Janeiro de 2020

Belo Horizonte/MG - R$ 1200

29 e 30 de Janeiro de 2020

Belo Horizonte/MG - R$ 10

Obs: Transmissão dos melhores momentos da Rstudio Conf em um auditório