Como identificar um "charlatão dos dados"? 🔍👣

Entenda o que leva a maioria dos projetos de analytics ao fracasso e o que pode ser feito para evitar que isso ocorra com você

Fala Data Hackers! Que tal mais uma newsletter bem polêmica pra começar essa terça-feira?Obs: Como teremos muitos feriados nas segundas nesse final de ano decidimos publicar a newsletter do Data Hackers as terças nesses casos, entendemos que nesse momento de distanciamento social e trabalho remoto que muitos estão vivendo é ainda mais importante nos desligarmos um pouco da tecnologia e descansar a mente.Bom, voltando ao assunto principal da edição de hoje, que tal falarmos um pouco dos, cada vez mais comuns, "Charlatões do mundo dos dados". Com o crescimento da popularidade da área de dados é normal que apareça um número cada vez maior de aproveitadores se passando por especialistas e esse post da dicas valiosas e bem humoradas de como identificar esse tipo de charlatão e como agir caso alguma  dessas pessoas vá de encontro a você.Além disso temos um ótimo motivo para falar de Inteligência Artificial nessa semana, pois o relatório State of AI 2020 acabou de sair do forno trazendo uma análise completa das principais novidades e tendências quando o assunto é IA. Mas não é só isso, vamos trazer artigos interessantes do mundo dos dados falando sobre as principais falhas em projetos de analytics e como evitá-las; Machine Learning em produção; Otimização de imagens com Python; Fundamentos de Data Lakes; A velha disputa entre Bayesianos x Frequentistas; dicas de cursos, eventos, vagas de emprego e muito mais. Podemos começar?

Bom... Nada melhor do que começar a semana com um daqueles posts polêmicos, bem humorados e repleto de conteúdo relevante, não é mesmo?Dessa vez trouxemos um post que fala dos "Charlatões dos dados". Sabe aquele profissional que promete uma solução milagrosa para um problema complexo? Pois é... Pode se tratar de um charlatão que só quer te persuadir.Num mundo cada vez mais inundado de promessas de emprego fácil com um salário bem gordo, os charlatões encontram ainda mais oportunidades de vender sua receita milagrosa, então é bom sempre ficar atento aos sinais para detectar esses farsantes!Apesar de parecer até mesmo um clickbait o post é bem interessante (além de super divertido) e mostra algumas formas de detectar pessoas com esse perfil, se afastar delas e até mesmo maneiras que diferentes profissionais podem atuar para se tornar mais confiável. (em inglês)

Com o aumento da popularidade de buzzwords como ML e AI, aumentam também o volume de fracassos em projetos da área de dados. Os motivos de fracasso podem variar muito mas na maioria das vezes o fracasso se dá devido a baixa qualidade dos dados disponibilizados para as equipes e modelos.

da equipe da Reforge, são apresentados os principais pontos de falhas em projetos de dados, as causas raiz desses problemas e estratégias para evitar que isso aconteça. Esse é mais um daqueles posts que todo profissional de dados deveria salvar nos favoritos e reler muitas vezes.

(em Inglês)

 

O relatório "State of AI" é sem dúvida nenhuma um dos relatórios mais completos quando o assunto são as mais novas tendências no mundo da inteligência artificial.

Produzido por dois investidores do mercado de AI, o relatório que já tem mais de 170 páginas apresenta as principais tendências da área em 2020 incluindo: 

  • Pesquisas de maior destaque na área de AI

  • Negócios que tem registrado maior impacto na industria

  • Como a regulação está avançando nos principais mercados

  • Um overview do mercado de trabalho na área

  • Ferramentas, artigos, projetos e novas tecnologias que tem se destacado

 (em inglês)

Nem todos sabem, mas existem diversos recursos em Python para realizar o processamento de imagens, uma dessas técnicas é equalização de histogramas, que permite ajustar os níveis de cinza de uma imagem automaticamente, garantindo um brilho e contraste balanceados de forma rápida e fácil. Nesse post o Data Hacker Alvaro Carneiro mostra como essa técnica pode ser utilizada e suas vantagens. (em Português)

Nesse post é apresentado um tutorial com os primeiros passos para colocar um modelo de ML em produção utilizando o AWS Sage Maker. (em Inglês)

Cassie Kozyrkov é Head of Decision Intelligence no Google e fez um vídeo super didático para tentar esclarecer as principais diferenças entra os Frequentistas e Bayesianos, ficou muito legal e vale a pena acompanhar esses 7 min de vídeo. (em Inglês)

Nesse artigo é apresentada uma arquitetura básica de Data Lake utilizando os recursos da AWS, um post bem interessante para quem quer dar os primeiros passos na área de engenharia de dados e entender as fases do processo de um pipeline de dados. (em Inglês)

VAGAS DA SEMANA

  • Experiência nas áreas de Modelagem/Business Analytics/BI e similares, preferencialmente em empresas do segmento financeiro;

  • Possuir sólido conhecimento em R e/ou Py;

  • Ter experiência com desenvolvimento de testes A/B para checar se seus insights estão no caminho certo;

  • Experiência em engenharia de dados ou BI

  • Experiência prática com processamento e armazenamento de grandes volumes de dados;

  • Conhecimentos em modelagem de dados relacionais/não relacionais;

  • Experiência em AWS;

Curso de Deep Learning do Yann LeCun 100% onlineEssa é realmente uma novidade bem legal para quem está em busca de aperfeiçoar seus conhecimentos em Deep Learning. O curso de DeepLearning do Yann LeCun foi disponibilizado no formato online e já é possível baixar todos os materiais e começar a acompanhar da sua própria casa. Se quiser ver a ementa e como ele é organizado é só clicar aqui. (em inglês). 

Quem aqui trabalha com tecnologia e ainda não passou por uma situação dessas?Dica pra quem utiliza o R:# Open a pdf filepdf("rplot.pdf")# 2. Create a plotplot(x = my_data$wt, y = my_data$mpg)# Close the pdf filedev.off()

Nate Silver faz suas estimativas para os Resultados da eleição presidencial de 2020 dos USANate Silver é considerado por muitos um dos maiores especialistas em previsões de pesquisas eleitorais e ganhou notoriedade a pouco mais de uma década, quando conseguiu prever as eleições do Obama. Nas últimas eleições sua metodologia foi fortemente questionada e não conseguiu ter o mesmo sucesso de anos anteriores, mas ele e sua equipe revisaram a metodologia e estão com previsões em tempo real para as novas eleições. Independente de acertar ou não os resultados, sua página apresenta detalhadamente a metodologia utilizada e usa de muitas técnicas de Dataviz para deixar tudo mais fácil de ser entendido, vale a pensa conferir!  (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

19 a 24 de outubro de 2020

7 a 22 de Outubro de 2020

19 a 22 de Outubro de 2020 - Evento online gratuito

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito