- Data Hackers Newsletter
- Posts
- SELECT "quanto foi nosso faturamento?" FROM vendas
SELECT "quanto foi nosso faturamento?" FROM vendas
AutoML do Google Sheets; um guia sobre monitoramento de modelos em produção; o jeito mais rápido de visualizar correlação
Fala, Data Hacker! Seja bem-vindo a mais uma newsletter! Geralmente, quando juntamos as palavras "dados não-estruturados" e "Query", já sobe aquele calafrio nas costas, não é? Que atire a primeira pedra quem nunca mandou aquele LIKE no meio das queries. Contudo, o Facebook parece que quer mudar isso, ao apresentar essa semana o que eles chamam de "Neural databases": bancos de dados que usam NLP como seu motor de busca, ao invés do famigerado SQL. Confira mais sobre essa novidade ainda nessa edição.E mais na news de hoje: AutoML do Google Sheets; um guia sobre monitoramento de modelos em produção; o jeito mais rápido de visualizar correlação, e muito mais.
Pesquisa de feedback da newsletter do Data Hackers
Queremos criar uma newsletter cada vez melhor para você, e para isso, seu feedback é muito importante.
e separe 2 minutinhos do seu dia para responder nossa pesquisa.
O Facebook anunciou essa semana as Neural Databases, sua nova abordagem para queries em dados não-estruturados. A ideia principal é eliminar o gap que existe hoje em linguagens como SQL, que são muito dependentes da semântica, onde apenas resultados exatos são retornados. Segundo o time de pesquisa, será possível utilizar linguagem natural para buscar por resultados nos bancos de dados com perguntas como "Qual o percentual de reviews positivos em filmes de terros dos anos 70?". Saiba mais sobre o assunto clicando aqui. (em Inglês)
Há quem diga que o verdadeiro trabalho de Machine Learning começa quando você precisa colocar o modelo em produção. Hoje ainda é muito obscuro para algumas pessoas como essas aplicações devem ser monitoradas no mundo real, para identificarmos falhas, envelhecimento de modelos, e antecipar problemas. Nesse guia traduzido pelo
você entenderá não só por que você deve monitorar seus modelos, mas também os desafios e até como começar. (em Português)
O pessoal da Tableau realizou uma pesquisa com mais de mil lideres de negócios (técnicos e não-técnicos) em 10 países para entender as cinco tendências que direcionam uma cultura de dados eficiente. Dentre as tendências, estão a Confiança, Talento, e o Comprometimento dos times de dados. (em Inglês)
Correlação é muito importante para entender como suas variáveis se relacionam, e existem diversas formas de você visualizar e entender esse relacionamento. Nesse post feito por Roman Orac, ele mostra como em apenas uma linha de código você pode criar um correlograma, usando nada mais que nosso famoso Pandas. (em Inglês)
Basicamente, Data Lineage é entender e rastrear de onde dados vem e como e onde eles são utilizados. A medida que os dados da sua empresa crescem, fica ainda mais difícil entender e controlar isso. O pessoal do Slack criou esse post para explicar como eles estão lidando com esse desafio. (em Inglês)
O "Copilot" chegou ao Google Sheets? Essa semana o Google anunciou sua novidade que estará disponível nos próximos dias: uma ferramenta de sugestão inteligente de fórmulas e funções direto na sua planilha.
para ver a funcionalidade em ação. (em Inglês)
Sempre surge a discussão sobre a diferença entre papéis em Data Science e Machine Learning que compartilham de algumas responsabilidades (Cientistas vs Analistas, Engenheiros de Dados vs Analytics Engineer, etc.) e uma delas é a diferença entre os Engenheiros de Machine Learning e Data Scientists. Enquanto, na verdade, essa diferença vai variar de empresa para empresa, o pessoal do
sobre algumas diferenças comuns entre esses dois papéis. (em Inglês)
VAGAS DA SEMANA
Python
SQL
Machine Learning
API REST
Cloud computing
Ter atuado de ponta-a-ponta em projetos de ML
Expertise em Python, SQL e Machine Learning
Experiência com AWS
Boa comunicação
Explicando Machine Learning em 5 níveis de dificuldadeComo você explicaria Machine Learning para uma criança? Nessa série da WIRED, eles chamam um especialista na área e pedem para explicar um conceito bem complexo para uma audiência diversa, como uma criança, um adolescente, um estudante e para outro especialista da área. Para esse episódio, eles chamaram Hilary Mason (ex-Cloudera e Bitly) para explicar. (Em Inglês)
Se o seu computador for um PC da Xuxa, não vai ser mais rápido não.
Uma visualização bem legal mostrando onde programadores Fortran tem trabalhado ao longo do tempo. Você imaginava que havia gente mexendo com Fortran na Apple? (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
21 de Setembro- Evento Gratuito e 100% Online
28 a 30 de Setembro - Evento Gratuito e 100% Online