• Data Hackers Newsletter
  • Posts
  • O quê uma Capivara admirando o pôr do Sol tem a ver com o futuro da Inteligência Artificial? 🌄

O quê uma Capivara admirando o pôr do Sol tem a ver com o futuro da Inteligência Artificial? 🌄

Conheça o DALL·E: o algoritmo que cria imagens realistas através de comandos de texto

Fala Data Hackers! O momento mais aguardando de 2020 enfim chegou... A hora de dar adeus a esse ano caótico e torcer para que 2021 venha cheio de esperanças, vacinas e aglomerações!Bom, está curioso para saber o quê uma capivara admirando o por do sol tem a ver com inteligência artificial? Na primeira newsletter de  2021 decidimos trazer o lançamento de um projeto que ainda vai dar o que falar, o DALL-E, um algoritmo treinado para criar imagens a partir de sugestões em textos, incluindo a pintura de uma capivara admirando o por do sol.Além disso vamos falar dos melhores livros gratuitos na área de Data Science; Como treinar seu modelo de Deep Learning mais rápido; Trouxemos as principais conferências online de Data Science e Machine Learning em 2021 para você já reservar na agenda; Datasets para evoluir seus projetos; Um resumo de 2020 em 20 diferentes aplicações de dataviz; Vagas de emprego e muito mais! Prontos para começar esse novo ano?

A OpenAI já chegou em 2021 de voadora e acabou de anunciar o lançamento de um projeto que é no mínimo INCRÍVEL!O DALL-E (que tem esse nome em uma combinação de Salvador Dalí + WALL-E da pixar é um projeto que utiliza uma versão do GPT-3 com 12 bilhões de parâmetros e foi treinado para gerar imagens a partir de descrições de texto, utilizando datasets que combinam textos e imagens.Deixa eu tentar explicar melhor, se você pedir para o DALL-E fazer uma pintura onde uma capivara está curtido o por do sol ele vai te retornar diversas opções como essas:Não importa o quão aleatório é o seu pedido, se pedir um caracol feito de uma harpa ele vai retornar muitas opções incluindo essas:E por aí vai... Se ainda não acredita vai logo conferir todos os detalhes no site do projeto.Segundo os próprios autores do projeto uma das possibilidades do algoritmo é a criação de versões antropomorfizadas de animais e objetos, combinando conceitos não relacionados de maneiras inimagináveis, renderizando texto e aplicando transformações a imagens existentes. (Em inglês)Bom a minha opinião pessoal é que esse projeto vai abrir um leque de soluções baseadas em inteligência artificial que ainda nem conseguimos imaginar, mas isso é assunto para o podcast de "Tendências em Data Science em 2021" (aguardem!).

Se você está buscando um dataset interessante para aplicar técnicas de análise de dados e enriquecer seu portfólio esse post é para você! O Victor Stein fez um trabalho super legal de extração de dados e construiu um dataset contendo diversas informações sobre o consumo de livros no Brasil da plataforma Skoob (a maior rede social para leitores do Brasil).

São informações sobre mais de 11 mil livros e incluem a avaliação média, número de páginas, ano de publicação além de outras informações sobre os autores dos livros.

E aí, está esperando o quê para começar a explorar esse conjunto de dados e evoluir seu portfólio de análises?  (em Português)

 

Se você é como 99% dos brasileiros eu aposto que entre suas metas e promessas de ano novo estão alguns tópicos relacionados a ler mais, estudar mais e gastar menos dinheiro (ou pelo menos gastar de uma forma mais controlada, certo?).

Caso tenha se identificado esse post é para você. Nessa lista temos os melhores livros gratuitos da área de Data Science, para você ler mais, estudar mais e não gastar nem um centavo a mais! A lista foi atualizada no final do ano e tem excelentes livros.

Agora é só começar a cumprir a promessa de "procrastinar menos em 2021",

e escolher qual vai ser o primeiro livro que você vai ler no ano! 

(em Inglês)

Se tem duas coisas que me irritam profundamente é:

1 - Ficar esperando horas para um modelo rodar

2 - Não ter grana para investir em um super computador para que os treinamentos rodem mais rápido

Nesse post o Data Hacker Alvaro Carneiro, da diversas dicas para otimizar algoritmos e conseguir treinar os modelos em menos tempo. Os exemplos são práticos e apresentam comparativos que após o uso das técnicas foi possível treinar modelos até 56% mais rápido que o caminho convencional. Esse é pra aplaudir de pé! (em Português)

A Data Hacker Carol Braga, fez um post bem diferente... E se você pudesse extrair os dados da sua banda preferida e fazer diversas análises em cima deles? Bom, no post dela além de mostrar como extrair e analisar os dados do Radiohead ela ainda mostra como deixar tudo isso automatizado. Mal posso esperar para testar com os dados dos "Barões da Pisadinha". (em Português)

Guarde bem essa sigla: NLP. Em 2021 ainda vamos ouvir muito sobre as técnicas de processamento de linguagem natural (ou text analytics). E para te ajudar a entender um pouco melhor sobre tudo isso o Data Hacker Guilherme Gomes fez um post mostrando como começar em Text Analytics utilizando o Python. O post é no formato tutorial com diversos exemplos de códigos em Python. (em Português)

Quer aprender a configurar um cluster ElasticSearch passo a passo? O Data Hacker Gerson Ramos fez um post que pode te ajudar nessa tarefa. (em Português)

O Data Hacker Gustavo Santos mostra como utilizar técnicas de estatística para selecionar quais as features mais importantes para o seu modelo de Machine Learning, um post muito interessante para quem está buscando  alternativas para selecionar atributos para modelos. (em Português)

VAGAS DA SEMANA

  • Cloud (AWS, Google Cloud etc);

  • Java ou Scala

  • Conhecimento em algum Banco de dados NoSQL (Mongo, Dynamo, Elastic, Cassandra etc).

  • Experiência em pipelines de fluxo de dados utilizando ferramentas de ETL;

  • Conhecimentos em plataformas de processamento paralelo massivo ex.: Hadoop, MapReduce ou Spark;

  • Experiência com alguma das ferramentas da stack de dados da AWS (Athena, Glue, Redshift, EMR, Kinesis);

  • 3 anos de experiência na industria de tecnologia

  • Formação em Engenharia, Matemática, Estatística ou áreas correlatas

  • Sólidos conhecimentos em arquiteturas de sistemas

  • C, C++ ou Python

  • Experiência em desenvolvimento de soluções com GPU's

  • Conhecimentos em Deep Learning e/ou AI

  • Experiência em Cloud e Desenvolvimento de Software

Que tal aprender a dançar com os robos da Boston Dynamics?A inteligência artificial chegou com tudo em 2021 e esse vídeo dos robôs da Boston Dynamics dançando está aqui para provar isso. Os robôs podem não ter tomado seu emprego ainda mas eles com certeza já dançam melhor do que eu e você.

Repitam comigo: "Salada não leva a nada, salada não leva a nada, salada... Não... Espera aí... O que está acontecendo?"

O ano de 2020 resumido em 20 visualizações de dadosEsse post tem uma proposta bem legal, a ideia foi resumir o ano de 2020 através de diversas visualizações de dados que destacam os principais contextos vivenciados ao longo desse caótico ano. Tem dataviz sobre Covid, Black Lives Matter, impactos na economia, incêndios ao redor do globo, eleições e muito mais! (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

12 de Janeiro de 2021 -  Evento Gratuito e 100% Online

28 e 29 de Janeiro de 2021 -  Evento Pago e 100% Online

30 de Março a 01 de Abril de 2021 -  Evento Pago e 100% Online

17 a 19 de Agosto de 2021 -  Evento Pago e 100% Online