- Data Hackers Newsletter
- Posts
- Descubra os top 20 projetos Open Source para Data Science em Python - Data Hackers
Descubra os top 20 projetos Open Source para Data Science em Python - Data Hackers
É verdade que o GDPR (a nova regulamentação de dados européia) vai acabar com o Data Science e Machine Learning?
Na Newsletter dessa semana, você irá descobrir quais os principais projetos open source envolvendo Machine Learning, Deep Learning, Data Science etc em Python! Entenderá também quais as diferenças entre ETL e ELT, e quando utilizar cada abordagem, aprenderá como rodar Python no Rstudio e ainda terá a oportunidade de se candidatar a vagas de emprego em Data Science em BH, RJ, SP e Porto Alegre!
Os Projetos Open Source são alguns dos principais fatores para o Data Science estar evoluindo de maneira tão rápida, pensando nisso
fez um estudo dos principais projetos open source em Python relacionados a Data Science, Machine Learning, IA e os ordenou de acordo com diversos critérios como número de pessoas envolvidas no projeto, nível de atividade e feedbacks positivos. (Em Inglês)
Se você trabalha com Engenharia de Dados, Business Intelligence ou Big Data certamente já utiliza ETL's no seu dia a dia, mas você já ouviu falar em ELT? Descubra mais sobre essa nova abordagem e quando utilizar cada um desses procedimentos
. (em Inglês)
Se você já utiliza o R, tem grandes chances de gostar muito do RStudio, uma IDE extremamente completa que surgiu para facilitar a vida dos apaixonados pela linguagem R. Mas... E se fosse possível utilizar o R-Studio para programar em Python?Já parou para pensar nisso? A galera do curso-r não apenas pensou nisso como criou esse
totalmente em português te mostrando o caminho!
Um dos maiores erros que os principiantes em Data Science cometem é tentar utilizar o ambiente de trabalho como sua própria Universidade. Não tem nada de errado em aprender enquanto trabalha, porém a maioria das pessoas faz isso de forma errada tentando aplicar modelos estatísticos complexos sem ao menos entender o problema que precisa ser resolvido. Esse infográfico vai te ajudar a entender os principais problemas encontrados nas empresas que podem ser solucionados (de forma não tão complexa) com o uso de Data Science e Machine Learning.
No próximo mês entrará em vigor uma nova legislação da União Européia que tem como objetivo regulamentar a forma como as informações dos cidadãos europeus circula na internet. Essa legislação aborda as formas como os dados são coletados, armazenados e analisados. Diante disso começaram a surgir vários rumores de que a área de Data Science e Machine Learning será fortemente afetada, mas será que é verdade? (em Português)
Um excelente livro para quem vem do mundo do Excel e quer começar a aprender como utilizar Data Science na prática. John Foreman, demonstra como é possível resolver diversos problemas comuns nas empresas utlizando Data Science, Excel e R. Um excelente material para quem está fazendo uma mudança de carreira e começando a encarar análises mais complexas.
VAGAS DA SEMANA
São Paulo/SP - Experiência na área de Vendas + Data Science. R, Python, Hadoop.
Belo Horizonte/MG - Python, Scikit-learn, Numpy, Nltk
Porto Alegre/RS - Mixpanel ou Snow Plow, conhecimento em ambientes na nuvem, como Google Cloud (BigQuery, Dataprep, TensorFlow, Data Lab etc)
Rio de Janeiro/RJ - Experiência na área de otimização, simulação e/ou modelagem preditiva.
Como é o ritmo de envelhecimento em diferentes países do globo?Neste artigo, a equipe do Nexo Jornal utiliza da visualização de dados para demonstrar como é cada vez maior a tendência de envelhecimento das populações dos diferentes países. (em protuguês)
PRÓXIMOS EVENTOS E MEETUPS
18/04/2018 - 08:00h as 19:00h
Florianópolis - R$ 265,00
*PS: O Allan Sene estará representando o Datahackers e marcando presença no TDC Florianópolis 2018, com a palestra:
ElasticSearch em Produção: Como vencer o grande vilão Big Data.