- Data Hackers Newsletter
- Posts
- Eu vejo dados sujos! Com que frequência?? O tempo todo! 😣😱
Eu vejo dados sujos! Com que frequência?? O tempo todo! 😣😱
Google Dataset Search - mecanismo de busca de datasets
Olá, Data Hacker! Você tem medos de ver dados limpos?! Então FECHE ESSA NEWS! O mundo dos profissionais de dados em sua maioria se resume a dissecar os dados: obter de fontes confiáveis, limpar e juntar, ver distribuições e padrões, pra só depois tirar bons insights, seja com modelos complexos ou simples análises. Nessa news vamos trazer várias ferramentas pra FACILITAR sua vida! Hoje tem: projeto Google Dataset Search, que é isso mesmo que o nome diz, um buscador de datasets, o artigo da Uber sobre seu Databook, sua ferramenta de catálogo e conhecimento de dados, o projeto DataViz da Ferdio, que mapea diversos tipos de visualizações e quando usá-las e muito mais! Olha aí!!
Discussão comum entre profissionais de dados, em
e em todos outros meios, o processo de catalogação, curadoria e descoberta de dados e insights através destes em uma organização é bem complexo.
Nesse artigo sensacional, a
Uber
descreve sua ferramenta
Databook
: uma plataforma de descoberta e exploração de metadados, fontes e insights. No texto, eles dissecam sobre sua infraestrutura, decisões de implementação e quais os princípios que guiaram o desenvolvimento da plataforma.
Você que está na fase de crescimento e adoção de dados na sua organização não pode perder! (Em Inglês)
Todo Cientista/Analista de Dados, principalmente os iniciantes, batalham muito para achar bons datasets para seus experimentos. A
decidiu dar uma mãozinha: disponibilizou o
Google Dataset Search
, um buscador de dados públicos! Ainda não temos muitos dados brasileiros, mas a ferramenta facilita DEMAIS não só encontrar, mas ver descrição e metadados dos datasets. Show!
O Engenheiro de Dados que nunca parou pra explicar a diferença entre um Data Warehouse e um Data Lake que atire a primeira pedra... Agora você pode responder com um link! haha!
A Xplenty fez um artigo pequeno e conciso explicando o que é cada um desses e como os conceitos de ETL e ELT (de Extract, Load e Transformation) estão relacionados com isso tudo. (em Inglês)
Explicar o que é Machine Learning é uma tarefa difícil... mas não para o Átila Iamarino do
! Em mais um video da série Nerdologia Tech, Átila explica o que é Aprendizado de Máquina de uma forma que até seu tiozão da Sukita vai aprender!
O Data Hacker
Fabio Ismerim
escreveu um artigo muito massa sobre como nos enganamos ao discutir sobre diversos assuntos pois consideramos uma visão muito restrita da realidade. Ele descreve isso como a crença na Lei dos Pequenos Números e mostra com experimento simples de amostragem como isso funciona. (em Português)
Vocabulário Visual: como se expressar com dados!Uma dica do Data Hacker Ricardo Storck no nosso Slack: Um Datasheet com um guia de como se comunicar com dados! A folha separa as visualizações em várias categorias: desvio, ranking, espacial, correlação, etc. e mostra, com exemplos, qual gráfico atende cada realidade.
VAGAS DA SEMANA
Superior completo, Bancos de Dados, SQL, Python/Java/PHP, DW, ETL
Superior completo, XP em tráfico de ads, Capacidade analítica de dados, DoubleClick/AppNexus, HTML, JS, Inglês Fluente
Escolha a melhor visualização para seu projeto!A agência Ferdio fez um projeto simplesmente incrível: uma lista com dezenas de tipos de visualizações, o Data Viz Project! No site, você consegue filtrar por tipo de entrada, forma, função e família. Todas as visualizações tem uma descrição detalhada de como ela funciona e uma lista de exemplos. Não deixe de consultar antes de montar aquele storytelling matador!
PRÓXIMOS EVENTOS E MEETUPS
10 de Outubro
São Paulo/SP - Grátis -
Concorra a um nanodegree da Udacity!
29 de Setembro
Belo Horizonte/MG - 2º Lote - Valor: R$ 100