- Data Hackers Newsletter
- Posts
- É preciso saber Estatística para trabalhar com Data Science? 📊😬
É preciso saber Estatística para trabalhar com Data Science? 📊😬
Comparação de modelos de análise de sentimento utilizando dados do Airbnb
Fala, Data Hacker! Começamos mais uma semana trazendo em primeira mão sua newsletter preferida.O assunto da vez é Estatística em Data Science, que foi o tema do mais recente episódio do podcast do Data Hackers. Convidamos alguns dos especialistas na área para explicar de uma vez por todas qual a relação de estatística com data science, as principais formas de análises e como os profissionais da área podem ampliar esses conhecimentos. Dessa vez o papo, além de técnico, está super divertido.Além disso resolvemos trazer alguns posts sobre diferentes assuntos como análise de sentimentos, modelos de classificação, séries temporais com machine learning, análise de Small Data e algumas dicas para ter mais produtividade ao programar em projetos de Data Science.E aí, pronto para começar mais uma semana? Vamos lá?
Estatística é realmente necessário para trabalhar na área de Data Science? Preciso fazer uma faculdade/pós graduação/MBA para aprender mais sobre o tema? E para quem já trabalha com estatística, o que é preciso para se tornar um cientista de dados?Para responder essas e mais perguntas convidamos algumas referencias em estatística que trabalham na área de Data Science para participar de um bate papo super divertido. Os convidados da vez foram Luciana Lima da A3Data e André Gabriel Calaça da Oper. Se você está ansioso para acompanhar esse bate papo e entender mais sobre aplicações de estatística em Data Science corre para ouvir esse episódio! (em Português)*Lembrando que você também pode ouvir nosso podcast no Spotify, Itunes, Google Podcast, Castbox ou no agregador de podcasts de sua preferência.
Existem muitas técnicas para avaliar e validar um modelo de Machine Learning de classificação, mas qual delas utilizar em cada momento?
É exatamente esse tema que o Data Hacker Marcelo Randolfo resolveu abordar em seu mais recente post. No artigo ele da dicas de como e quando utilizar diferentes técnicas e fala sobre os erros mais comuns e como evitá-los.
(em Português)
O Data Hacker Lucas Oliveira teve uma ideia genial e executou passo a passo, coletou os dados do site Airbnb e utilizou para fazer uma comparação de diferentes modelos de análise de sentimentos através de técnicas de NLP.
Ele comparou 4 diferentes tipos de modelos, explicou todos os passos dessa comparação e ainda fez tudo utilizando a língua portuguesa. Esse post serve também como referência para qualquer cientista de dados que está buscando maneiras de ampliar seu portfólio de análises. Vale muito a pena ver de perto!
(em Português)
No mundo real nem sempre temos grandes quantidades de dados. Seja em uma pesquisa clinica ou em dados esportivos em muitos casos o volume de dados não será tão extenso quanto desejado, mas ainda assim é possível trabalhar com algoritmos de Machine Learning e é
que esse artigo vai te mostrar. (em Inglês)
Você sente que poderia ser mais produtivo enquanto cria projetos de Data Science? Não se preocupe, essa lista veio para te ajudar. Nesse post você vai encontrar 11 dicas que vão desde boas práticas de programação, um guia para aprendizado constante, dicas de bibliotecas e muito mais. (em Inglês)
O Data Hacker Carlos Eduardo Souza disponibilizou uma série de posts sobre um tema muito relevante: Séries Temporais com Machine Learning. A sequencia de posts é uma verdadeira aula sobre o tema, com um passo a passo em Python, utilizando várias libs atuais como o prophet. Fica a dica!
(em português)
VAGAS DA SEMANA
Formação superior em estatística ou área correlata
Experiência com estudos estatísticos e modelos matemáticos
SQL
Desejável conhecimentos em R ou SPSS ferramentas de BI ou Visualização de Dados (PowerBI ou similar)
5+ anos de experiência com plataformas de tecnologia
3+ anos de experiência com implementação de Data lakes
Sólidos conhecimentos do ecossistema Hadoop
Spark
Hive, Impala, Spark SQL ou Presto
A proposta desse livro é bem direta, repassar os principais conceitos de Machine Learning em poucas páginas, uma centena de páginas para ser mais exato. Excelente leitura para quem precisa se aprofundar no tema mas está sem tempo para acompanhar conteúdos muito longos, tudo muito direto com o foco no essencial. (em inglês)
As maiores chuvas nas capitais brasileiras desde 1990Acompanhar o Nexo jornal é uma excelente forma de ver exemplos de data visualization aplicado a contextos super atuais. Nesse post não foi diferente, eles disponibilizaram uma análise incrível dos dados de precipitação para comparar o cenário atual com as maiores chuvar já registradas no Brasil. E aí? Você acha que o cenário mudou muito?. Vale muito a pena conferir as análises! (em Português)
PRÓXIMOS EVENTOS E MEETUPS
18 a 20 de Fevereiro de 2020
São Paulo/SP - Gratuito
19 de Fevereiro 2020
São Paulo/SP- Gratuito
27 de Fevereiro 2020
Goiania/GO - Gratuito
Não teremos newsletter na próxima semana pois a equipe do Data Hackers vai entrar em recesso no carnaval, estaremos de volta em Março com novos conteúdos!