Janeiro: As verdades que você precisa saber sobre Big Data

Fevereiro: Como estruturar seu time de Data Science de forma efetiva

Olá, Data Hacker! Este ano de 2018, ano no qual a nossa comunidade nasceu, já acabou. Quantas conquistas tivemos!Em 22 de Janeiro de 2018, fizemos nosso primeiro envio. Depois lançamos o Slack, que hoje consta com mais de 1400 membros. Fizemos 2 edições do Bootcamp Data Hackers, onde pudemos ensinar os primeiros passos em Data Science para gente do Brasil inteiro, de Terezina ao interior paulista.Por fim, atendendo a muitos pedidos, lançamos o podcast, que já tem mais de 10 mil plays. Foram 4 episódios com convidados de renome na área de Data Science, Machine Learning e Engenharia de Dados.Antes de irmos para a nossa retrospectiva, gostaríamos de agradecer a você! Nossa comunidade é cada vez mais forte e representativa por causa de sua participação. Que 2019 seja muito especial e você atinja seus objetivos. E não se esqueça que estamos aqui pro que der e vier! Conte conosco!

Agora vamos para a última news de 2018! Compilamos uma retrospectiva com os links mais clicados de todos as nossas newsletters!

Neste artigo você vai ter uma visão sincera de como os projetos de "Big Data" funcionam na prática. Conhecer as diferenças entre um cientista  de dados e um engenheiro de dados e ver que aquela prometida solução milagrosa e plug and play que resolverá todos seus problemas envolvendo dados em grande volume está bem longe de existir. (em Português)

, ex-Head de Analytics do 

 conta de quais formas os times de Data Science podem ser estruturados dentro de uma organização de maneira efetiva. Ele conta dos modelos Centralizado vs Descentralizado, quais tipos de cientistas existem (Tipo A e Tipo B) e o que que eles necessitam de contrapartida para trabalhar com eficiência. (em Inglês)

Ainda na batalha para conscientizar o mercado sobre o que é realmente Data Science, o Data Hacker 

, Head de Analytics na 

, conta 

pragmaticamente

 toda sua experiência e visão sobre Ciência de Dados. Sem tentar vender sonhos, Lages ensina o que é Data Science e o que é necessário para ser um bom profissional na área.

Por fim, finaliza dando a dica que: unicórnios não existem, mas 

times fortes de Data Science existem

 e podem ser montados sim! Leitura obrigatória do semana! (em Português)

Na primeira parte de seu guia, Allan Sene explica um dos momentos mais tensos na vida de um candidato: o processo seletivo. Através de uma abordagem sem rodeios e bem-humorada, Allan traz dicas cruciais para passar em processos seletivos como 

Nubank

Globo.com

MaxMilhas 

e até 

Spotify

! (em Português)

Em dos posts mais comentados nas listas e comunidades de Data Engineering do mundo inteiro nessa semana, a 

, startup brasileira do Recife, mostra como funciona seu pipeline de dados,  datastores e ferramentas de análises, além de explicar todos os porquês de suas decisões de arquitetura. Imperdível! (em Inglês)

Com a popularização da área de Data Science, muitas empresas tiveram sua atenção direcionada a projetos de Inteligência Artificial, Machine Learning, Data Science, Big Data, ou qualquer outra 

buzzword

 que os faça sorrir. Nesse artigo, o autor salienta esse e outros problemas que frustram profissionais de dados, onde a falta de alinhamento de expectativas pode ser o maior vilão desse processo. (em Inglês)

O que mais tem por aí é tutorial de aplicações de Deep Learning usando TensorFlow ou PyTorch. Mas e a teoria por trás disso tudo? Nesse artigo, o Data Hacker 

 explica o funcionamento de Percéptrons e as várias funções de ativação! Mais um artigo no

(em Português)

O Data Hacker Leonardo Ferreira conta nesse inspírador artigo toda a sua trajetória em Ciência de Dados. Começando literamente "do zero", Leonardo desbravou sozinho o mundo de Data Science e conseguiu um feito único: o título de Kaggle Kernel Master. (em Português)

Nesse post extremamente FODA o time da Analytics Vidhya fez uma seleção extremamente criteriosa de projetos de Data Science com tutoriais passo a passo e datasets inclusos!!! Os projetos passam por análise de regressão, modelos de classificação, séries temporais, text mining, manipulação de conjuntos enormes de dados, visão computacional, sistemas de recomendação e muito mais.

Os projetos estão divididos por nível de conhecimento (iniciante, intermediário e avançado) e todos acompanham os datasets e tutoriais. O que você está esperando para ampliar seu portfólio e aprender ainda mais??

 (em Inglês)

Aprender Data Science, vai muito além de fazer um curso e ganhar um certificado. Durante esse o processo de aprendizado o Data Scientist vai precisar obter uma série de habilidades que a maioria das pessoas nem imagina existir.

Como Data Hackers, acreditamos que existem várias formas de adquirir esses conhecimentos, em algumas delas como em faculdades, bootcamps e alguns tipos de cursos online você vai precisar desembolsar uma grana, mas existem muitas outras formas de aprender sem gastar nem um centavo e justamente disso que esse 

 trata! (em Inglês)

Se você ainda não faz ideia de qual o papel do Engenheiro de Dados em uma equipe de Data Science, não se preocupe. Dessa vez trouxemos um guia extremamente completo sobre a profissão feito pela Udacity!

O post aborda os principais aspectos dessa profissão, como por exemplo:

  • O que é engenharia de dados?

  • Qual a diferença entre engenheiros de dados e cientista de dados?

  • Quais as habilidades e ferramentas de um engenheiro de dados?

  • Quanto ganha um engenheiro de dados?

  • O que fazer para se tornar um engenheiro de dados?

Ou seja, se você trabalha na área de dados 

 é mais um daqueles posts obrigatórios para compreender o papel de cada um na equipe! 

(em Português)

É claro que você conhece a Amazon. Seja por ter comprado aquele Kindle baratinho ou por usar a plataforma de serviços web deles: a AWS. E é sobre esse último que iremos falar.

Na última semana de novembro, a AWS anunciou que iria abrir seu curso de Machine Learning. Trata-se de uma série de cursos gratuitos que irão preparar você para utilizar as melhores ferramentas de Machine Learning da AWS.

O que achei mais legal é que a plataforma da AWS oferece trilhas específicas de acordo com o perfil do aluno. Por exemplo, se você é um engenheiro de software, você focará nos cursos A, B e C; caso você seja um Data Scientist, poderá focar nos cursos D, E e F. (em Inglês)