Data Science + Game of Thrones! 😮

Será que o meu time está precisando de um Engenheiro de Dados?

 

Fala Data Hackers! Preparados para mais uma edição da nossa newsletter?Após 8 temporadas e mais de 70 episódios a série Game of Thrones vai chegar ao fim... Mas será que isso é mesmo verdade?Se depender do Data Hackers a série não acaba tão cedo, e já no principal post dessa news o Data Hacker Lucas Oliveira vai mostrar como podemos utilizar Deep Learning para gerar a continuação de GoT.*Obs: Tudo isso sem Spoilers! 

E tem mais: Descubra como melhorar a qualidade dos dados abertos do Brasil; entenda qual o momento ideal para que a sua empresa tenha um engenheiro de dados; aprenda o básico sobre SVM; Veja 6 dicas para otimizar a performance do Athena; conheça 5 paradoxos de Machine Learning, dicas de cursos, vagas de emprego, eventos e ainda mais... Vamos começar?

Você sabia que já é possível utilizar inteligência artificial para reproduzir processos de pensamento humano, como reconhecimento de objetos, tarefas como dirigir um carro, gerar imagens e até mesmo textos completos?

Partindo dessa ideia o Data Hacker Lucas Oliveira criou um post sensacional e

, onde ele utiliza de avançadas técnicas de Deep Learning para gerar uma continuação alternativa para sua série favorita, Game of Thrones.

Fique tranquilo pois não tem nenhum spolier no post que é uma verdadeira aula. Além de ser um artigo muito interessante o passo a passo utilizado nas análises pode ser replicado em outros tipos de estudo (ou até mesmo para gerar a continuação de outra série que você preferir). (em português)

Por serem duas profissões ainda muito novas é bem comum que em diversas empresas o papel do cientista de dados se confunda com o do engenheiro de dados. Nesse

é possível entender as principais responsabilidades de um engenheiro de dados e como saber o momento certo para contar com esse profissional na sua equipe ou empresa.

(em inglês)

 

Sabia que existe uma forma de medir a qualidade dos dados abertos?

, Fernando Baralho mostra como é medida a qualidade dos dados abertos, e utiliza como exemplo o trabalho feito em cima dos dados abertos do Tesouro Nacional para mostrar os passos necessários para que esse indicador evolua. (em português)

Para complementar o post deixamos aqui mais essas 2 dicas:

 - Modelo criado por Tim Berners-Lee (também criador da Web) para medir a qualidade dos dados abertos.  (em inglês)

- Um repositório de dados públicos brasileiros disponibilizados em formato acessível e gratuito. (em português)

Estudante brasileiro desenvolve programa que prevê piora no quadro de diabéticosO software criado pelo estudante Rafael Teixeira analisa pedidos de exames do paciente e utiliza modelos preditivos para descobrir se aquela pessoa terá um infarto, ou perda das funções renais, por exemplo, nos próximos 6 a 8 meses.

Quer conhecer mais sobre SVM? Que tal começar por esse post e entender melhor sobre um dos modelos de machine learning mais utilizados atualmente. (em inglês)

Se você utiliza os recursos da Amazon Web Services para analisar dados em grande escala certamente conhece o Amazon Athena e sabe o quanto otimizar a performance pode tornar sua vida mais fácil. Pensando nisso a Upsolver preparou um guia para o Athena com 6 dicas de otimização. (em inglês)

*Obs: Se quiser ir mais a fundo no assunto tem esse outro post da AWS com mais algumas dicas.

Um paradoxo normalmente é um argumento que contraria os princípios básicos do pensamento humano, e por mais que seja estranho é algo bem comum em Machine Learning. Em seu último post, Jesus Rodriguez apresenta e explica 5 paradoxos relacionados a área de Data Science e Machine Learning. (em Inglês)

No dia 18 de junho de 2019 vai rolar o Google Cloud OnBoard, um treinamento gratuito de introdução técnica ao Google Cloud Platform (GCP) para desenvolvedores. O evento ocorrerá em São Paulo e será transmitido em tempo real em mais sete salas de cinema espalhadas pelo Brasil (Brasília, Belo Horizonte, Curitiba, Florianópolis, Porto Alegre, Recife, Rio de Janeiro). (em português)

VAGAS DA SEMANA

Florianópolis - SC

  • Conhecimento em Bases de Dados (linguagem SQL)

  • Experiência com ETL

  • Ferramentas de BI (Power BI/Pentaho,Scripts/Macros)

  • Desejável conhecimento em Python

  • Necessário Inglês e Espanhol intermediário

  • Estudante de Ciências Exatas, Computação ou áreas relacionadas a análise de dados e Machine Learning

  • Python ou Java

  • SQL preferencialmente utilizando Postgres ou SQLite

  • Conhecer de Jupyter, Pandas, Sklearn, Tensorflow, Hadoop and Spark é um diferencial

  • Escrever e falar inglês é desejável mas não é obrigatório

GPS ideológico mostra a posição de mil influenciadores brasileiros no TwitterA Folha preparou um projeto de visualização de dados totalmente interativo chamado GPS Ideológico, que analisa comportamento de 1,7 milhão de usuários e influenciadores políticos. Com base nesses dados o sistema classificou 1.000 influenciadores brasileiros e posicionou os perfis numa reta ideológica, do ponto mais à direita ao mais à esquerda.  (em português)

PRÓXIMOS EVENTOS E MEETUPS

16 de maio de 2019

Ministério do Planejamento - Brasília/DF - Grátis

22 - 23 de junho de 2019

WeWork Savassi - Belo Horizonte/MG

24 - 26 de junho de 2019

São Paulo/SP - A partir de R$ 494

*Obs: Esse valor é com o

para os Data Hackers!

30 de Junho de 2019

AUDITÓRIO CDI - USP - São Paulo/SP