- Data Hackers Newsletter
- Posts
- Data Hackers: Como a Rede Globo utiliza Machine Learning para não perder sua audiência?
Data Hackers: Como a Rede Globo utiliza Machine Learning para não perder sua audiência?
Machine Learning e experimentos online para evitar o cancelamento no GloboPlay
Não é novidade pra ninguém que a Globo é uma das empresas que mais investe em tecnologia no Brasil e que grande parte desse investimento é feito para melhorar a análise dos dados. Eles contam com várias equipes focadas em Engenharia de Dados, Data Science e Big Data espalhadas por suas diferentes empresas, globo.com, rede globo, globoplay etc.Mas você já parou pra pensar em como eles utilizam esses dados no dia a dia? Quais modelos eles utilizam e o que fazem com tanta informação?Na newsletter de hoje vamos trazer alguns materiais que mostram a fundo como a Globo trabalha com dados e como essas informações são essenciais para eles não perderem a atenção da audiência! E tem mais: Vamos falar mostrar como foi o primeiro Bootcamp da comunidade Data Hackers, vamos falar de boas práticas em codificação para data science, mostrar os principais modelos de regressão que todos ciêntista de dados deveria conhecer e muito mais!
Veja como foi o primeiro Bootcamp do Data Hackers!
No último final de semana fizemos o primeiro Bootcamp do Data Hackers, um treinamento intensivo de 20h, passando pelos principais conceitos de Data Science e Machine Learning.Os alunos tiveram a oportunidade de aprender mais sobre algumas das linguagens e ferramentas mais utilizadas para Data Science nas empresas como SQL, Python, Metabase e Jupyter.
A primeira edição do evento foi em Belo Horizonte, mas estamos planejando levar para outras cidades do Brasil, se você tem interesse que o Bootcamp seja realizado na sua cidade, basta
e continuar acompanhando as novidades da nossa newsletter!
A globoplay investe pesado em análise de dados para melhorar seu produto. Nessa palestra o Tiago Motta (líder técnico do time de Growth Hacking da globo.com) vai explorar as técnicas de Machine Learning utilizadas para reduzir o churn do GloboPlay.
Para isso ele mostra como fez para encontrar os assinantes mais prováveis de cancelar e as métricas correlacionadas, especialmente no uso de técnicas de clusterização e classificação em dados desbalanceados.
Em sua palestra ele ainda fala um pouco sobre:
Algorítimos de Recomendação
Testes AB Simultâneos
Análise de Cluster
Balanceamento de Dados
Monitoramento de métricas
O mais legal é que ele vai direto ao ponto, e mostra detalhes do dia de trabalho deles sem enrolação!
São apenas
, mas o conteúdo é sensacional!!! Separe um tempo e não deixe de assistir!!!
Os modelos de regressão são algumas das soluções mais utilizadas por cientistas de dados na atualidade. Vários modelos preditivos tem por trás técnicas de regressão linear, regressão logística entre outras. Nesse post incrível, o time da
Analytics Vidhya
aborda
e como escolher quando utilizar cada uma delas! (em Inglês)
Provavelmente você já sabe, mas os Style Guides são convenções de boas práticas para o desenvolvimento e escrita de códigos em projetos. O objetivo desses guias é facilitar a leitura e compreensão de grandes bases de códigos. O que poucos sabem é que até mesmo as linguagens voltadas para Data Science tem Style Guides e seguir essas boas práticas podem ajudar a aumentar a produtividade da sua equipe. Outro ponto legal é que o Google criou alguns style guides e disponibilizou para a comunidade vejam só:
Se você ainda não conhece o Podcast Pizza de Dados, tem que conhecer!!! Além de ser um podcast 100% em português que fala unicamente sobre assuntos relacionado a dados, é produzido por uma galera que manda muito bem!!! Nesse episódio eles resolveram abordar um tema que está dominando a mídia no Brasil, os
Bots Políticos
. Pra quem ainda não conhece o tema, os Bots Políticos podem nos ajudar a conhecer um candidato novo ou tentar barrar artificialmente um crescimento natural de um candidato da maioria. Pra saber mais sobre o assunto, só ouvindo
:). (em português)
Já que o tema central da newsletter de hoje são as organizações Globo, que tal entendermos como a Globo.com utiliza Machine Learning para tomar decisões no dia a dia? Nessa apresentação de Slides, o Renan Oliveira, engenheiro de dados na globo.com, conta um pouco de como o ML e Data Science é utilizado no dia a dia, passando pela arquitetura, análises e modelos utilizados por eles. Vale a pena conferir! (em português)
Managing Data in MotionEssa dica veio do nosso canal do slack, do datahacker André Gomes, e é direcionada para quem quer ganhar mais conhecimentos na parte de engenharia de dados. Managing Data in Motion mostra técnicas para integrações de dados em sistemas complexos incluindo técnicas de ELT's e ETL's. (em inglês).
VAGAS DA SEMANA
Graduação em áreas como Marketing, Ciência da Computação, Matematica, Estatistca, Finanças ou Economia), conhecimento em programação (PHP/Python/VB etc).
3 anos de experiência, (Python/R/Java/Scala), T-SQL
Tem conhecimento em alguma linguagem de programação (SQL, Python, R ou Excel VBA)
Lógica de programação, Conhecimentos em Python.
Data Visualization Cheat SheetO pessoal da PolicyViz preparou esse guia com tudo que você deve e não deve fazer quando o assunto é visualização de dados. Nesse material eles mostram quando utilizar cada tipo de gráfico e como combinar cada tipo de informação da maneira correta! No fim ainda dão dicas do que não deve ser feito! Vale a pena conferir o artigo.
PRÓXIMOS EVENTOS E MEETUPS
30 e 31 de agosto, Belo Horizonte/MG
*Link com 30% de desconto para os Datahackers!
20 de outubro, São Paulo/SP
*Link com 10% de desconto para os Datahackers!