O quê você precisa saber para trabalhar com dados em 2021 😎💼

Como Funciona uma Árvore de Decisão: Teoria e Prática

E aí Data Hackers! Prontos para mais uma semana?Hoje começamos com um bate papo super interessante sobre o quê você precisa saber para trabalhar com dados em 2021! Nesse papo a Kizzy do canal programação dinâmica se juntou com o Lages do Data Hackers e abordaram diversos assuntos como os principais papéis numa equipe de dados, estrutura de time, desafios e muito mais.Além disso, hoje a newsletter está repleta de conteúdos feitos por participantes da nossa  comunidade e eles vão abordar assuntos como os conceitos por trás de uma árvore de decisão; Como utilizar algoritmos para prever churn em uma empresa; Como extrair a "explicabilidade" de um modelo de Machine Learning e aumentar sua confiança; como utilizar Deep Learning para detectar faces.E não para por aí, além desses conteúdos vamos trazer uma dica de livro de ML que você paga somente após a leitura, dica de eventos que vão rolar em breve incluindo uma imersão em Data Science, meme da semana, dataviz e dicas de emprego.Vamos lá!

Nesse papo super divertido a Kizzy do canal programação dinâmica (que já participou do Podcast do Data Hackers sobre

, lembra?) convidou o Lages (eu mesmo! kkkk) (co-fundador do Data Hackers e diretor de Data & Analytics da Hotmart) para discutir sobre diversos aspectos importantes para quem deseja trabalhar (ou já trabalha) na área de dados.

Entre os diversos temas abordados nessa conversa, falamos de estrutura de equipes, desafios de quem está começando na área, como começar um time do zero numa empresa, quais os principais papéis numa área de dados, quais as habilidades essenciais para um DS, para um DE, para um DA e por aí vai...

Bom o resultado ficou bem legal e pode ajudar quem está vivendo esse desafio, você pode conferir

. (em Português)

Se você já atua na área de Data Science, certamente já ouviu falar do modelo de Árvore de Decisão. Mas será que você sabe realmente o que acontece por trás do algoritmo?

Pensando em responder essa pergunta e conectar a teoria a prática, o Data Hacker Leonardo Berlatto fez um post bem completo, onde mostra toda a abordagem matemática do modelo e da exemplos de sua aplicação seguindo um passo a passo, hands-on, em Python. Vale a leitura! (em Português)

 

O Data Hacker Milton Neto trouxe um assunto bem interessante no seu mais recente post: como obter a "explicabilidade" de um modelo de Machine Learning e quais suas aplicações?

Quem já assistiu algum documentário da Netflix sobre o tema AI (dica: 

,

) sabe que vivemos em um mundo onde é cada vez maior o volume de decisões tomadas por algoritmos. Muitos desses modelos são os chamados "black-box", onde não há, por exemplo, transparência dos fatores que levaram o modelo a realizar uma classificação.

Diante dessa realidade tem se tornado cada vez mais importante a necessidade de explicar as decisões por trás do modelo, o que vem levando ao surgimento de diversas técnicas e ferramentas com esse objetivo. No post o autor mostra as principais abordagens para se obter a explicabilidade ou interpretabilidade de modelos, e apresenta detalhadamente 6 dessas técnicas. Leitura obrigatória para qualquer um que trabalha na área de ML. (em Português)

Esse projeto promete te ajudar a transformar suas funções Python em micro serviços completos e prontos para colocar em produção. (em Inglês)

A lib Pandas é uma das queridinhas dos Cientistas de Dados (tanto que de tempos em tempos falamos dela por aqui). Sabendo disso o Data Hacker Anello resolveu fazer um post reunindo tudo o que você precisa saber para começar a utilizar essa lib. (em Português)

Mais um post onde o assunto é a Lib Pandas, dessa vez o Anello fez um guia para quem precisa fazer operações SQL em DataFrames no Pandas. (em Português)

VAGAS DA SEMANA

  • Experiência com Data Science/Engineering;

  • Experiência com Sistemas Distribuídos;

  • Habilidades em programação com SQL e Python;

  • Experiência com Cloud Computing, preferencialmente AWS;

  • Experiência com Linux;

  • Experiência com Apache Spark;

  • Experiencia com plataformas de Stream de Dados (Kafka, Kinesis);

  • Proficiência em SQL e Python;

  • Sólida experiência no desenvolvimento e deploy de modelos de MachineLearning em ambiente de produção;

  • Sólidos conhecimentos em modelagem de dados relacional e não relacional;

  • Conhecimentos em Estatística;

A dica de livro essa semana tem um formato diferente do tradicional, você tem a possibilidade de ler gratuitamente o conteúdo e só depois pagar (e ainda escolher quanto acha justo pagar pelo livro). O mais novo livro escrito por Andriy Burkov (mesmo autor do "The Hundred-Page Machine Learning Book") aborda o tema Machine Learning Engineering. É um livro bem completo que passa por todas as etapas da construção de modelos de ML. (em Inglês)

O meme da semana é dica do nosso co-fundador Allan Sene, para não nos deixar esquecer jamais como cada "Join" do SQL funciona.

A álgebra relacional agradece a lembrança!

Entendendo como anda a vacinação contra o COVID no Brasil através de visualizações de dadosApós 3 meses de vacinação no Brasil já é possível entender como estamos avançando. Para facilitar esse entendimento o time do Nexo Jornal criou diversas visualizações incríveis mostrando o aumento diário na aplicação de vacinas na população brasileira, para isso cruzaram informações do tipo de vacinas e características sociodemográficas dos vacinados. PS: Gostaria de agradecer a equipe do Nexo Jornal que tirou o paywall obrigatório para acessar os conteúdos de gráficos e assim possibilitar que toda a nossa comunidade veja os conteúdos. Observação: Se você gostou do conteúdo deles uma dica é assinar para apoiar o trabalho e garantir que eles possam continuar essa inciativa incrível.(em Português)

Em mais uma imersão de dados, o Guilherme Silveira e a turma da Alura vão realizar 05 aulas gratuitas para te ajudar a desenvolver o seu mais novo projeto em Data Science.- Evento 100% gratuito- 03 a 07 de maio- Projeto prático para ampliar seu portfólio]Obs: As inscrições estão abertas até 02 de maio, não perca!

29 de Abril - Evento Gratuito e 100% Online

08 a 16 de Julho - Evento Gratuito e 100% Online

17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online