Overdose de belas dataviz e morte aos dashboards! 🔪

Desenvolvendo Modelos de Entity Resolution com Deep Learning

Fala, Data Hacker! Pô, você, assim como eu, está cansado de ver galera fazendo dashboard com dado que ninguém precisa? Mas você, assim como eu, é apaixonado por belas visualizações de dados? Essa news é pra você! Achamos uma news muito massa que traz só dataviz tops pra você se deleitar e também um ebook muito bom, feito pela ThoughtSpot, uma das empresas que mais entendem de viz no mundo, sobre como essa maré de dashboards pode ser um grande desperdício para as organizações.Trouxemos também o grande desafiador de Redshift, Snowflake e BigQuery, uma PoC do Paypal com Kafka e BQ, aquele meme bacana e mais! Bora?!

Quem que acompanha essa news e não fica apaixonado quando vê uma bela visualização de dados?! Pois é! Nas nossas pesquisas pra trazer a visualização da semana, me deparei com esse Medium aqui do AnyChart, lib de javascript pra dataviz. Ele traz semanalmente uma seleção TOP de visualizações de alta-qualidade.

Dá pra dar follow e se inscrever pra receber a newsletter semanal deles também. Dica imperdível pra você que também é inimigo dos gráficos de pizza! :D (Em Inglês)

Resolução de Entidades é um problema recorrente em todos os domínios: desde duplicação de registros até criação de dados mestres. Esse post da Peak traz como eles criaram uma lib baseada em um modelo de Deep Learning pra resolver vários problemas de forma genérica, dando escala aos seus cientistas e engenheiros na aplicação de Entity Resolution em várias aplicações. Não deixe de ler! (em Inglês)

 

Aride Chettali, Data Architect no Paypal, conta os aprendizados na Prova de Conceito (PoC) que criou para fazer o streaming de 25 bilhões de eventos do Kafka para o Google BigQuery.

Uma arquitetura simples e robusta que pode, inclusive, ser um ótimo projeto para seu portfólio de Engenharia de Dados hein. Fica a dica! (Em Inglês)

Google BigQuery, Amazon Redshift e Snowflake já dominam o quarterão das soluções de DW na cloud. Mas tem um novo player cada vez mais fortes por aí: o Firebolt. Prometendo resultados 10x mais rápidos, por custos bem menores, o Firebolt parece ser uma tecnologia bem interessante. Nesse post, você vai poder entender um pouquinho mais sobre essa ferramenta, que deve dar uma mudada nesse mercado de dados. (em Inglês)

Qualidade dos dados é um grande desafio em todo time de dados, dos Cientistas aos Engenheiros, de pequenas empresas a gigantes de tecnologia. Nesse post da Wrike, Alexander Eliseev traz as dimensões da qualidade dos dados e uma série de práticas para você e seu time implementar essa gestão tão importante e crítica. (em Inglês)

VAGAS DA SEMANA

  • 4 anos de xp em dados

  • Python ou R

  • Ferramentas de BI (Tableau, Looker, PBI, etc)

  • Experiência com Big Data

  • Inglês Fluente

  • XP em liderança de times de dados

  • XP com produtos de data eng.

  • XP em contratação de times

  • Boa comunicação oral e escrita

Os Dashboards estão mortos!Já falamos um pouco sobre esse assunto, mas esse ebook do pessoal da ThoughtSpot traz o quanto essa mania de dashboards e relatórios podem ser nocivos pra cultura data-driven das organizações, além de desperdiçar muitos recursos. (em Inglês)

"Nossa nova loss (função) pode ser facilmente integrada em qualquer método existente."Design Pattern é docinho pra todo Data Scientist. Sim, com certeza!

O Índice Dow Jones, desde 1900Nesse ano o índice Dow Jones, que acompanha as ofertas na maior bolsa de valores americana, faz 125 anos. O pessoal da EEAGLI fez esse gráfico muito legal mostrando a evolução do índice. Eles também marcam, no topo, os acontecimentos importantes, como fundação de empresas como Apple e grandes recessões do mercado.

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

01 de Junho - Evento gratuito e 100% online

10 de Junho - 13:00  - 17:25 BRT - Evento gratuito e 100% online

10 de Junho - Evento gratuito e 100% online

08 a 16 de Julho - Evento gratuito e 100% online