Usando dados para combater o crime! 🚔

Data Forensics: Usando dados para combater a corrupção

Fala, Data Hacker! Apesar do nosso nome, nunca paramos pra usar nossas habilidades "Hackers" em "Data" pra descobrir crimes ou combater a corrupção. Mas, a partir de sexta, essa relação entre Hacker e Data saiu só do nome: no último episódio do nosso podcast, trouxemos o Osvaldo Aranha Neto, Head de Data & AI na Azure/Microsoft, que especialista em Data Forensics. Quer saber mais sobre esse conceito? Se liga no nosso destaque da news!Ainda: como a NVIDIA está usando Deep Learning para melhorar performance e gráficos dos games, um Guia de Analytics Engineering feito pelos criadores do dbt, memes, vagas e muito mais!

Num dos bate-papos mais interessantes e divertidos do nosso podcast, trouxemos Osvaldo Aranha Neto, Head de Data & AI Azure na Microsoft, que tem mais de 10 anos de experiência no assunto, pra falar de Data Forensics.

Esse conceito, pouco conhecido na nossa área, consiste em utilizar técnicas avançadas de análise de dados para investigar e combater o crime: seja do lado de instituições públicas, como a PF e MPF, quanto em empresas privadas, como Delloite e outras grandes consultorias.

No episódio, Osvaldo traz casos interessantes de como a aplicação de analytics foi essencial para se descobrir esquemas grandes de corrupção e deu dicas pra quem imagina seguir nessa área tão específica, porém bem instigante! Não perca! (em Português)

Você já sabe que GPUs mudaram o mundo quando começamos a usá-las para treinar modelos de Deep Learning. Mas a NVIDIA não está só desse lado da moeda. Em um dos projetos mais bacanas da atualidade, a empresa lançou o DLSS - Deep Learning Super Sampling - tecnologia que aumenta a qualidade e também a performance dos jogos, coisa que era antagônica em quase todos os cenários.

Esse post explica em detalhes como a tecnologia do DLSS funciona e mostra seus ganhos incríveis! (em Inglês)

 

Com a mudança da Stack de dados, vem surgindo um perfil novo na área: o Analytics Engineer. Profissional que está sendo contratado por empresas maduras no que se refere a data, o Engenheiro de Análise usa ferramentas como dbt e Dataflow ou Data Platforms para cuidar dos dados e entregá-los cada vez mais intuitivos e limpos para análise.

Esse guia, feito pelos criadores dessa posição, o pessoal do dbt, fala tudo que se precisa saber pra se tornar e pra se implantar essa cultura na sua empresa. (Em Inglês)

O Data Hacker Jonys de Matos fez um post tão completo e interessante sobre Feature Selection no nosso blog que não poderia ficar de fora dessa news! Jonys explica como funciona e como usar a lib Boruta, que facilita e melhora muito a seleção de features relevantes para fazer ML. (em Português)

Um dos grandes dilemas hoje é a possível exposição de dados privados a analistas e cientistas de dados de empresas que portam tais informações. Trabalhar com Dados Sintéticos pode ser uma solução. Neste post bem bacana, o Data Hacker Ricardo Pinto explica como usamos GAN pra fazer essa geração e dá um exemplo com a YData, ferramenta que vem ganhando espaço nesse assunto. (em Português)

Fazer código e documentação, sem sair do python, você já sabe... Notebooks surgiram justamente pra resolver esse dilema de trazer códigos bem explicados, muito frequente em Data Science. Agora, fazer diagramas e desenhos de arquitetura? Sim, com a lib diagrams, feita pelo MinJae Kwon, agora isso é possível, de forma fácil e intuitiva, sem ter que ficar buscando imagens pela internet. Veja que legal! (em Inglês)

VAGAS DA SEMANA

  • Python, Glue, Athena

  • SQL, Presto, Postgresql

  • Experiencia em Big Data

  • Redshift

  • Certificações Cloud (Azure, GCP ou AWS)

  • Conhecimento em negócios na área financeira

  • Inglês avançado

  • Inglês Fluente

  • +4 anos de xp em dados

  • Entendimento de dados ponta a ponta

  • XP com SQL e NoSQL

  • XP com open-source

  • XP com liderança de times

A plataforma Apache Kafka já é quase que unanimidade em todo time de Data Engineering que trata realtime. Mas não é uma coisa simples de se entender. O Mitch Seymor fez um livro LINDO contando uma historinha, quase que uma fábula, com animais se comunicando pela floresta usando os conceitos do Kafka, como Tópicos, Eventos, Produtores e Consumidores. Dica do Igor de Souza lá no nosso Slack. (em Inglês)

"Ah, rapaz, vai assim memo!"Humberto Pereira mandou no #random do nosso Slack

O preço das baterias elétricas nos últimos anosUma das maiores revoluções da humanidade, sem dúvida, foi o crescimento de dispositivos tecnológicos nas mãos das pessoas. Um dos catalisadores disso certamente é a queda no preço das baterias elétricas. Essa publicação do Our World in Data mostra como foi essa evolução nos últimos 30 anos. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

08 a 29 de Junho - Evento Gratuito e 100% Online

(Iniciativa do Rodrigo Teoria lá no #data-engineering do nosso slack)

08 a 29 de Junho - Evento Gratuito e 100% Online

08 a 16 de Julho - Evento Gratuito e 100% Online

(Participação do Pietro Oliveira nosso community manager)

08 a 16 de Julho - Evento Gratuito e 100% Online