Tendências em Data Science para 2020 ↗👀

Como a Kate se tornou Data Scientist em 6 meses sem ter nenhum conhecimento em programação anteriormente

Fala, Data Hacker! Estamos de volta com mais uma edição da sua newsletter favorita!Você por acaso já parou para imaginar quais serão as principais tendências em Data Science em 2020? Qual será a próxima hype? Teremos muitas novas "modinhas"? Será que aquela velha promessa relacionada a inteligência artificial vai finalmente ganhar o mercado ou será descontinuada?Pois é exatamente esse o assunto que vamos falar na volta de mais uma temporada do Podcast do Data Hackers!Mas tem muito mais, quer ver?Vamos mostrar como uma garota que ainda não sabia programar conseguiu dar a volta por cima e se tornar uma cientista de dados em seis meses; vamos apresentar como problema "muilti-armed bandits" pode ser utilizado para otimizar soluções de machine learning; nessa edição vamos falar um pouco de web scraping e dar dicas para quem quer utilizar essa técnica; compartilharemos o que há de novo no Pandas 1.0.0 e no RStudio 1.3; além disso tudo ainda temos conteúdos relevantes de NLP e sobre os desafios de colocar em produção modelos complexos.E aí o que está esperando? Bora pros conteúdos? 

O grande anúncio dessa semana é que o Podcast do Data Hackers está de volta! E para voltar com força total convidamos duas pessoas incríveis para o bate papo: Os Community Managers da comunidade Data Hackers - Marlesson Santana e Mario Filho.Dessa vez o objetivo foi discutir a fundo quais serão as principais tendências da área de Data Science, Machine Learning, Data Engineering e Big Data em 2020. Se você também está curioso para descobrir o que esses malucos acreditam que será tendência nesse ano corra logo para ouvir esse episódio! (em Português)*Lembrando que você também pode ouvir nosso podcast no SpotifyItunesGoogle PodcastCastbox ou no agregador de podcasts de sua preferência.

Calma, esse post não é um clickbait. Não vamos falar que 6 meses é o tempo necessário para uma pessoa que não sabe nada se tornar um Cientista de Dados desejado pelo mercado, mas a história da Kate Marie Lewis merece destaque. Ela era phd em neurociência (sem conhecimentos em programação) e durante 6 meses trabalhou duro para se tornar uma Data Scientist.

ela mostra quais foram os passos para encarar o medo da tecnologia e se desenvolver. (em Inglês)

 

Fique atento pois é bem raro encontrar um post com um conteúdo tão relevante em português! O Data Hacker Marlesson Santana, escreveu

incrível explicando detalhadamente os conceitos por trás do problema "multi-armed bandits", um clássico desafio de Reinforcement Learning. No fim, ele mostra quais as principais aplicações dessa técnica na solução de problemas do mundo real. CONTEÚDO IMPERDÍVEL. (em Português)

O Data Hacker K. Delphino fez uma introdução muito legal sobre Web Scraping para quem ainda é novo no assunto. No post ele mostra algumas das principais técnicas e ferramentas utilizadas em Python para a extração automatizada de dados de páginas da internet. (em Português)

Desde os primórdios da internet o uso de Web Scraping (utilizar algorítimos para extrair dados de websites de forma automatizada)  gera muita polêmica e questionamentos. Mas após uma longa discussão, a justiça americana decidiu que em geral o uso de Web Scraping não é ilegal em muitos casos (mas existem exceções). (em Inglês)

Veja as novidades dessa biblioteca que é amada por Cientistas de Dados do mundo todo. (em Inglês)

Veja as novidades dessa IDE incrível, que foi desenvolvida para atender as mais diversas necessidades dos Cientistas de Dados.

Obs

: Já é possível utilizar Python no RStudio, vale a pena testar conhecer as possibilidades dessa ferramenta. (em Inglês)

O NLP (natural language processing) é um conjunto de técnicas que estuda os problemas da geração e compreensão automática de línguas humanas naturais.

o time da Microsoft reuniu diversas dicas de boas práticas com exemplos reais sobre o assunto. (em Inglês)

O avanço das técnicas de Machine Learning tem aumentado consideravelmente a complexidade dos modelos que precisam ser colocados em produção. Criado pela OpenAI, o modelo GPT-2 promete se comunicar de forma muito semelhante ao ser humano, mas para isso ele possui mais de 1,5 bilhões de parâmetros o que exige um auto poder computacional para seu funcionamento. Daí surge o grande desafio, como colocar em produção super-modelos como esse? (em Inglês)

VAGAS DA SEMANA

  • SQL

  • Machine Learning ou Modelagem Estatísica (GLM)

  • Python ou R

  • Ter atuado em projetos de Data Science

  • Conhecimento em ferramentas de BI ou Visualização de Dados (PowerBI, Tableau, Metabase ou Qlik)

Obs

: Se você mora em outra cidade e tem interesse em se mudar para BH a Hotmart tem diversos incentivos para ajudar na mudança.

  • Experiência com o desenvolvimento de modelos de Machine Learning

  • Testes AB com modelos de ML

  • Experiência com modelos em produção

  • ETL e pipeline de dados

As 5 etapas que garantem o sucesso de um projeto de Data ScienceNosso community manager Mario filho está de volta, e dessa vez ele vai apresentar quais as 5 etapas essenciais para garantir o sucesso em um projeto de Data Science. Vale a pena aprender com esse vídeo que é uma verdadeira aula! (em Português)

Qual o destino do lixo plástico no mundo?E mais uma vez a equipe do Nexo Jornal trás uma análise incrível sobre um tema altamente relevante para o cenário que vivemos atualmente. Nesse post, eles utilizaram muitas técnicas de visualização de dados para explorar o destino do plástico que consumimos e descartamos. Vale a pena conferir! (em Português)

PRÓXIMOS EVENTOS E MEETUPS

03 a 07 de Fevereiro de 2020

Curitiba/PR - 1 kg de alimento não perecível

06 de Fevereiro 2020

São José dos Campos/SP- Gratuito