Inteligência Artificial até no dia dos pais? 👴

Entenda como Cientistas de Dados estão se tronando "ultra-produtivos"

Fala, Data Hacker! Sejam bem-vindos a semana181 da sua newsletter preferida!Bom... Já que o último domingo foi dia dos pais, já vamos começar mostrando uma iniciativa do Mercado Livre que utilizou IA para reproduzir a voz do pai, já falecido, do ex-jogador Zico e criar uma emocionante homenagem para o ex-jogador de futebol. Mas não é só isso, vamos mostrar na prática como você pode utilizar Deep Learning e criar um algoritmo para fazer o mesmo.Mas não é só isso, ainda nessa news vamos falar sobre o que alguns Data Scientists tem feito para se tornarem "ultra-produtivos"; Mostraremos os segredos por trás da Hadoop e como o processamento paralelo e distribuido pode facilitar a vida de quem precisa analisar um grande volume de dados; Dicas do diretor de pesquisa do Google para quem está iniciando a carreira em Data Science; Além desses destaques temos muitos outros conteúdos, dicas de eventos online, vagas de emprego e muito mais!

Na semana do dia dos pais o Mercado Livre fez uma ação bem interessante, utilizou inteligência artificial para recriar a voz do pai do ex-jogador de futebol da seleção brasileira Zico e prestar uma homenagem para o jogador. O resultado da ação ficou incrível e pode ser acessado nesse link. Eu pessoalmente acho muito legal ver uma tecnologia polêmica como a "voice cloning" sendo utilizada para fazer o bem (para quem não sabe muitas pessoas utilizam esse tipo de tecnologia para aplicar golpes e enganar pessoas como Deep Fake ou para colocar robôs para fazer vendas fingindo ser alguém famoso).Mas você sabia que um cientista de dados pode fazer uma iniciativa bem parecida utilizando algoritmos de Deep Learning em Python?Nesse post incrível, o engenheiro de ML George Seif mostra um passo a passo de como fazer voice cloning utilizando Python. Nessa imagem você consegue entender melhor a arquitetura por trás de um algoritmo desse tipo.Além de explicar o conceito, o post mostra o passo a passo de como reproduzir um texto utilizando qualquer voz que você tenha acesso. (Obs: Use com moderação e para fazer o bem, eu não gostaria de receber uma ligação de um robô com a voz do Silvio Santos tentando me vender a próxima Tele Sena)Para ler o post completo clique aqui. (Em Inglês)

Já ouviu falar no conceito de "ultra-produtividade" na área de Data Science? Com o crescimento dos times de dados e aumento de toda a hype em torno de Machine Learning, Deep Learning e AI vemos que nem sempre os projetos estão sendo eficientes e esse conceito vem para tentar quebrar essa barreira.

Nesse artigo o autor apresenta o conceito e mostra como a combinação de um processo bem organizado com etapas automatizadas e uso das devidas ferramentas pode aumentar a eficiência dos profissionais da área. (em Inglês)

 

O Data Hacker Iury Leal fez um artigo muito completo com uma introdução ao Apache Hadoop e suas tecnologias. No texto ele fala de HDFS, MapReduce apresenta o poder do processamento paralelo e distribuído, destacando as vantagens e mostrando quando utilizar estes recursos.  (em Português)

Peter Norvig trabalha como diretor de pesquisas no Google e decidiu compartilhar dicas essenciais para quem ainda está começando na área de dados. No post ele fala um pouco sobre a imensidão de conhecimentos da área de dados e mostra como uma pessoa que está iniciando na área pode se organizar para obter esses conhecimentos. (Em Inglês)

"Design Patterns" é um conceito muito importante na área de desenvolvimento de software e está sendo cada vez mais aplicado na área de Machine Learning. Esse post propõe um debate sobre o tema, compartilhando boas práticas no desenvolvimento de modelos e destacando os principais riscos nesse processo.  (Em Inglês)

A Data Hacker Nina Pinheiro fez um post que mais parece um guia definitivo de pré-processamento de dados. Ela não só mostra o passo a passo envolvido no pré-processamento de dados, mas compartilha dicas, códigos e até mesmo uma linda poesia inspirada no assunto. (Em Português)

A galera do Curso-R fez um tutorial mostrando como transformar os gráficos do ggplot2 em animações incríveis. (Em Português)

A Data Hacker Debora Gobbo sempre publica conteúdos incríveis no nosso blog e dessa vez não poderia ser diferente. Em seu post mais recente ela mostra o passo a passo de como fazer um bom Data Storytelling utilizando Python. (Em Português)

Nesse post a equipe de engenharia de dados do Hurb mostra os segredos por trás do desenvolvimento de sua plataforma de dados com dois objetivos: estabelecer uma única fonte de verdade e tornar os dados confiáveis. (Em Inglês)

VAGAS DA SEMANA

  • Experiência em consulta de dados com linguagem SQL

  • Experiência com modelagem de dados, ETL/ELT

  • Conhecimentos em Data Mart e Data Warehouse (metodologias Star schema e Snowflake schema, etc)

  • Conhecimentos em ferramentas que apoiam no pipeline de dados (Airflow, Pentaho, Talent, Stitch Data, etc).

  • Conhecimento em linguagem Python, Scala ou similares.

  • Conhecimento em Governança de Dados (DMBOK, Catalogação de dados)

  • Python e PySpark

  • Conhecimentos na implementação de modelos em produção

  • Boas habilidades com manipulação de dados (SQL, Spark entre outras)

  • Experiência no uso de clouds

  • Noções de DevOps – Docker, CI/CD

  • Noções de Machine Learning e modelagem

Como construir uma IA verdadeiramente inteligenteSerá que a inteligência artificial que estamos construindo é realmente inteligente?Essa é a questão levantada por Melanie Mitchell nesse vídeo. Professora e Phd em IA, Melanie Mitchell é uma das maiores referências no assunto, tendo passado as últimas décadas desenvolvendo pesquisas e escrevendo livros sobre inteligência artificial. Nesse vídeo ela apresenta uma provocação muito interessante e diz que a IA nunca será verdadeiramente "inteligente" até que possa fazer algo exclusivamente humano: fazer analogias. (Em Inglês)

E na sua empresa? Os engenheiros de dados já conseguiram se livrar dos dados inconsistentes?

Dica do Allan Sene co-fundador do Data Hackers.

Aposto que todo mundo aqui já ficou frustrado (ou empolgado) quando um integrante de sua banda preferida resolveu seguir carreira solo... Mas será que a decisão de seguir a carreira impacta positivamente na popularidade dos artistas?Pensando nisso a equipe do The Pudding resolveu criar uma visualização de dados incrível, comparando os números do Spotify de artistas que decidiram seguir carreira solo com os números de sua antiga banda. A análise mostra alguns pontos bem interessantes e curiosos, vale a pena conferir! (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

17 a 19 de Agosto - Evento Gratuito e 100% Online

18 de Agosto - Evento Gratuito e 100% Online

17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online

28 a 30 de Setembro - Evento Gratuito e 100% Online