- Data Hackers Newsletter
- Posts
- Quais as maiores tendências na área de Dados em 2021? 😏🔮
Quais as maiores tendências na área de Dados em 2021? 😏🔮
O que é bias-variance tradeoff
Fala Data Hackers!Preparados para descobrir as maiores tendências que vão acontecer (ou não) no mundo de dados em 2021? Respeitando a tradição gravamos maus uma edição do podcast sobre esse tema!Além disso vamos dar dicas imperdíveis de produtividade no Jupyter Notebook, explicar um passo a passo para quem ainda está começando na linguagem R, discutir sobre o tradeoff envolvendo bias-variance, mostrar como funciona uma regressão linear e muito mais. Além dos posts incríveis feitos pela nossa própria comunidade vamos divulgar eventos e vagas de emprego na área de dados. Vamos começar?
O Podcast do Data Hackers voltou com tudo em 2021!
Para manter a tradição de 3 anos, vamos ver o que os fundadores da comunidade Data Hackers e Community managers acreditam que serão as maiores tendências na área de dados no ano de 2021.
No episódio de tendências que rolou no ano passado nós acertamos vários pontos (quem aí ainda vê bikes da Yellow e patinetes elétricos nas ruas?) mas erramos alguns pontos importantes também (não previmos nem mesmo a pandemia...). O objetivo nesse novo episódio é tentar acertar o que vai ser tendência de fato em no ano de 2021 num papo divertido, regado a muita informação relevante do mundo dos dados, piadas e muita futurologia!
Além dos fundadores (Allan, Lages e Paulo)
conta com a participação do Mario Filho, Marlesson Santana e Pietro Oliveira, community managers do Data Hackers.
Lembrando que você pode encontrar o podcast do Data Hackers no
,
,
,
e muitas outras plataformas (em português)
Se você está por dentro do que se passa na área de dados certamente já ouviu falar da linguagem R. Para tentar ajudar as pessoas que estão começando a utilizar o R o Data Hacker Ronaldo Baltar fez um post muito legal onde ele mostra todos os passos iniciais na linguagem R.
Além disso ele fez um tutorial de instalação e uso da IDE RStudio que permite que os cientistas de dados sejam muito mais produtivos. Se você nunca utilizou essa ferramenta eu recomendo fortemente que você acesse o post e a conheça melhor.
Obs: Antes de começar o debate R x Python saiba que é possível utilizar o RStudio para criar projetos em Python também, ok?
Abra sua mente, essa IDE conta com excelentes recursos para facilitar o dia a dia de qualquer Cientista de Dados.
(em Português)
Você sabe o que é bias-variance tradeoff e como isso impacta o seu modelo de Machine Learning? Não?
Independentemente da resposta acima, acredito que você tenha se deparado com alguns comportamentos inesperados depois da validação dos seus modelos, mais conhecidos como "overfitting" ou "underfitting".
Para entender melhor os como os conceitos de bias-variance afetam os modelos de Machine Learning o Data Hacker Carlos Alberto Bonfim
fez um post bem interessante mostrando visualmente esses conceitos e dando dicas de como ajustar melhor os modelos.
(em Português)
Se você ainda é novo na área de dados o conceito de regressão linear é um dos mais importantes quando pensamos em modelos de classificação. Para facilitar a vida de quem ainda está iniciando, o Data Hacker Carlos Alberto Bonfim resolveu demonstrar os conceitos por trás dessa técnica e
l de como usar Regressão Linear em Python.
(em Português)
Pode falar que depois que você assistiu a série "O gambito da rainha" veio aquela vontade de aprender a jogar Xadrez tão bem quanto a Beth Harmon (mas você falhou miseravelmente nas primeiras tentativas de jogar contra o computador). Bem, o Data Hacker Octavio Bomfim Santiago escolheu outra alternativa e decidiu utilizar técnicas de Deep Reinforcement Learning para hackear o tabuleiro de Xadrez. O resultado (e o passo a passo) de tudo isso você vê
.
(em Português)
Você ainda acha que a acurácia é uma boa forma de avaliar a eficiência de um modelo de Machine Learning? Nesse post o Data Hacker Clébio Oliveira, mostra outras alternativas para serem utilizadas quando você estiver em busca das melhores métricas para validação de modelos de ML.
(em Português)
Se você busca ser sempre mais produtivo no dia a dia não deixe de acessar esse post. Ele apresenta 4 dicas simples, porém valiosas para deixar os notebooks mais eficientes.
(em Inglês)
Desde a criação da comunidade um dos canais mais relevantes que temos é o nosso blog/medium. Nele a própria comunidade escreve os conteúdos e fazemos questão de impulsionar através da nossa newsletter.
Com o crescimento da comunidade resolvemos mudar um pouco a forma com que as pessoas contribuem para o nosso blog mas fique tranquilo, a publicação continua super fácil.
Guia para enviar posts para o blog do Data Hackers
Temos uma planilha com sugestões de temas relevantes para a comunidade - Link da planilha
Você vai precisar criar uma conta no medium (caso não tenha)
Escrever o post e submeter
Enviar um email para [email protected] com o assunto Proposta de post: [TÍTULO DO SEU POST], no corpo do email, coloque o link do rascunho do post.
Vamos avaliar o post e te tornar um Escritor do Data Hackers
Post Publicado!
Observações:
¹ Os temas sugeridos na planilha são opcionais, você continua podendo publicar sobre qualquer assunto que julgar relevante no mundo dos dados, a ideia das sugestões é para ajudar pessoas que querem contribuir mas não sabem sobre o que escrever
² Os posts da planilha serão divulgados na newsletter garantindo um engajamento ainda maior
Se quiser entender mais temos
explicando o passo a passo
VAGAS DA SEMANA
Conhecimentos em R ou Python;
Entender conceitos estatísticos, incluindo testes e distribuições;
Noção aprofundada em Matemática, Estatística, Machine Learning e Ciência da Computação.
Experiência em Geoestatística (diferencial)
Conhecimento em Informações Geográficas (diferencial)
Experiência com ciência de dados/machine learning
Programação em Python e SQL
Conhecimento de nuvem (preferencialmente Azure e AWS)
Obs: Vaga exclusiva para mulheres mas no
tem diversas outras vagas nas áreas de de tecnologia e dados.
Se você pretende utilizar Data Science para analisar o comportamento dos usuários que deixam de utilizar algum produto ou serviço, comece por este livro. Além de explicar detalhadamente como utilizar o poder dos dados para combater o "Churn" de usuários, o livro disponibiliza exemplos de códigos para você tentar replicar as mesmas técnicas nos seus projetos. No link acima, é possível ter acesso ao conteúdo do livro online de maneira gratuita e também é possível adquirir uma cópia física ou ebook. (em inglês)
Será que a Amazon arruinou o nome Alexa? Post interessante diretamente do Instagram do Statista, com os dados referente a nomes de recém nascidos nos USA decidiram partir para uma análise interessante: "Será que a Amazon acabou com a popularidade do nome Alexa, após dar esse nome para sua assistente virtual?". O que dá pra ver é que ano após ano a escolha do nome Alexa para as filhas tem sido cada vez mais rara por lá. (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
06 e 07 de Abril - Evento Gratuito e 100% Online
30 de Março a 01 de Abril de 2021 - Evento Pago e 100% Online
17 a 19 de Agosto de 2021 - Evento Pago e 100% Online