Como explicar Data Science até para sua avó 👵

Supletivo DH: Data Cloud Snowflake Como a Zillow vem perdendo milhões de dólares devido a falhas em seu produto de predição de preços de imóveis

Fala, Data Hacker. Chegou a hora de ler mais uma edição da sua newsletter preferida!O conteúdo principal de hoje é um formato totalmente novo, depois de anos precisando explicar para as pessoas novas na área o que realmente é a Ciência de Dados, decidimos criar um vídeo curto e de fácil entendimento para esclarecer de uma vez por todas como a área funciona e as principais diferenças entre o papel de um cientista de dados e um analista de dados. Agora ficou fácil de explicar para os seus familiares sobre a sua atuação, basta compartilhar esse vídeo.Obs: Se você ainda não respondeu a pesquisa State of Data Brazil ainda da tempo! O maior mapeamento do mercado de dados brasileiro continua no ar e você ainda pode ajudar a comunidade com suas respostas. A pesquisa já conta com mais de 1.900 participantes, está esperando o quê para enviar suas respostas?E mais, ainda nessa edição você vai conferir:

Live exclusiva sobre a pesquisa State of Data Brasil 2021+ Sorteio de Adesivos!

Fique de olho na nossa newsletter e nosso canal do Youtube, na semana do dia 15/11 vai rolar um sorteio de 100 packs de adesivos da comunidade Data Hackers!Para participar é muito fácil, basta preencher a pesquisa State of Data 2021 e selecionar a opção "Quero participar do sorteio de adesivos" ao final da pesquisa.

Se você trabalha na área de dados já deve ter passado por alguma situação que precisou explicar o que você faz no dia a dia... Nós passamos por isso quase toda semana e sabemos que nessas horas diversas perguntas vem a cabeça:- Como explicar que nosso trabalho na área de dados gera muito valor para as empresas?- Como desvincular a atuação do Cientista de Dados de outras atuações como Analista de BI?- Como contar minimamente sobre o nosso dia a dia, ferramentas e sistemas que utilizamos?Mas além desses desafios existe outro (que talvez seja o maior deles):- Como explicar Data Science de forma rápida e objetiva sem que as pessoas percam o interesse no assunto?Bom, esse foi o objetivo do mais novo vídeo do canal do Data Hackers, explicar Data Science de forma visual, objetiva e em apenas 100 segundos.Acreditamos que toda a comunidade pode se beneficiar com esse vídeo, então aproveite para compartilhar com outras pessoas, deixar seu feedback e pedir qual outro tema gostaria de ver explicado em 100 segundos no nosso canal! (em português)

Na mais recente série de posts do Data Hacker Hugo Zanini, ele resolveu mostrar um passo a passo de como fazer análises de sentimento em Python e em textos 100% português.

Além de mostrar como fazer o modelo utilizando comentários reais da Google Play Store para as análises, ele também mostrou como ajustar o BERT para realizar análise de sentimentos em português e como colocar o modelo em produção a partir da criação de uma API (FastAPI + Uvicorn + Docker).

A série é composta por dois posts:

 (em Português)

 

Essa semana uma notícia inesperada balançou o mercado imobiliário americano, levando as ações da Zillow a cair mais de 20%. Tudo isso ocorreu porque a empresa decidiu abandonar o mercado de compra e venda de imóveis baseada em seu modelo preditivo, que estava levando ela a perder milhões e a ter mais de 7 mil imóveis "empacados".

Em seu esclarecimento a companhia não deu todos os detalhes, mas deixou bem claro que "seu modelo de precificação é, na melhor das hipóteses, um indicador defasado e realmente nada bom em um mercado que não está se movendo agressivamente para cima e para a direita".

Sabemos que importante aspecto de um modelo de Machine Learning é a relação com o negócio e que um dos pontos essenciais de um modelo é o acompanhamento dos resultados no mundo real, porém na internet já existem milhares de comentários mostrando como os imóveis da Zillow estão sendo vendidos por preços exorbitantes, ou seja, algo deu muito errado. (em Inglês)

Um dos grandes desafios da área de AI é resolver problemas de raciocínio envolvendo o senso comum, isso causa alguns questionamentos como a grande dificuldade que modelos tem de resolver problemas que são fáceis até mesmo para crianças do ensino fundamental. Visando evoluir nesse ponto a OpenAI treinou um modelo para resolver problemas matemáticos escolares e os resultados já são bem promissores. Será que agora a vida dos estudantes vai ficar mais fácil?. (Em Inglês)

Num mundo cada vez mais imediatista, muitas vezes uma base sólida é ignorada em detrimento a aprender tarefas práticas. Mas será mesmo que um iniciante na área de dados deveria começar já em um curso de Machine Learning? Segundo o Google, não. Esse post mostra um roadmap para quem está entrando na área ou para quem já começou de forma errada e entende que precisa de reforçar conhecimento nos principais pilares para se diferenciar. (em Inglês)

Esse post apresenta um biblioteca muito interessante em Python, a "ParShap" que promete ser muito eficiente na descoberta de quais as features que estão provocando overfitting e consequentemente uma redução na performance do modelo. (em Inglês)

VAGAS DA SEMANA

  • 3 anos ou mais de experiência com desenvolvimento de relatórios gerenciais;

  • Graduação em áreas de Tecnologia, Engenharia, Estatística ou similares;

  • Ótimos conhecimentos em SQL, Tableau, Excel e Google Sheets

  • Conhecer ferramentas de Web/App Analytics, como por exemplo Google Analytics, Firebase e outras;

  • Formação superior completa em área computacional e pelo menos 4 anos de experiência profissional após a graduação, com Computer Vision ou Machine Learning;

  • Experiência no desenvolvimento e otimização de modelos de Machine Learning;

  • Experiência com bibliotecas como OpenCV, SKlearn, PyTorch e frameworks como TensorFlow e Keras;

  • Conseguir ler papers e implementar modelos e arquiteturas “state-of-the-art” de ML. 

Supletivo DH: Data Cloud SnowflakeEssa semana vai rolar Supletivo Data Hackers e o tema vai ser Snowflake! Pra quem ainda não conhece, esse é um evento online com o objetivo de explorar ferramentas no formato hands-on. Dessa vez o evento vai ocorrer no dia 09 de novembro (terça) às 20h. (em Português)

Dica do Data Hacker Rodrigo Teoria no nosso

No mês que ficou marcado pela realização da COP-26, principal cúpula da ONU para debate sobre questões climáticas, o time da Nexo jornal decidiu compartilhar um infográfico bem interessante sobre as emissões acumuladas de CO² em todo o mundo desde 1750. (em Português)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

09 de Novembro - Evento Gratuito e 100% Online

08 a 12 de Novembro- Evento Gratuito e 100% Online

08 a 11 de Novembro- Evento Gratuito e 100% Online