- Data Hackers Newsletter
- Posts
- O Dia Internacional do Vazamento de Dados
O Dia Internacional do Vazamento de Dados
A nova versão do Kubeflow vai te fazer ficar apaixonado por MLOps
Fala, Data Hacker! Seja muito bem-vindo a mais uma newsletter! Esperamos que estejam bem e seguros. Essa semana foi marcada por muita exposição de dados de usuários das maiores plataformas sociais do mundo. Teve dado exposto do Facebook (incluindo do próprio Markinho Zucks), Linkedin e até Clubhouse.O que marcou essa leva de dados expostos foi o fato deles terem sido adquiridos através de técnicas de web scraping. Ou seja, a maioria dos dados adquiridos estavam expostos publicamente (como seu perfil aberto do Facebook) e tiveram seus dados combinados e enriquecidos com fontes externas. Muito se é discutido sobre o uso de técnicas de raspagem de dados para coletar informações sobre sites, como definir a linha que separa a coleta entre o legal e o ilegal. Esses dados expostos podem acender novamente esse debate.E mais na edição de hoje: como quebrar um modelo de ML em 20 dias; um repositório cheio de dicas de MLOps, e o novo documentário da Netflix sobre viéses em reconhecimento facial.
Milhões de usuários do Linkedin, Facebook e Clubhouse tem seus dados expostos online
500 milhões de usuários do Linkedin tiveram seus dados expostos essa semana: os dados coletados foram colocados a venda e contém informações sobre nomes, emails e até endereços. O Linkedin informou que os dados que foram coletados aparentam ser informações expostas publicamente na plataforma e que foram adquiridos via web scraping.
Brecha expõe 1,7 TB de dados dos clientes da fintech brasileira iugu: uma suposta falha de segurança na fintech brasileira iugu deixou um servidor desprotegido por, pelo menos, uma hora, expondo 1.7 TB de dados pessoais e bancários dos clientes da empresa. O pesquisador Bob Diachenko expõe a falha no Twitter. Patrick Negri (founder e CTO da iugi) também escreveu um post sobre o assunto.
1.3 milhão de usuários do Clubhouse tem seus dados expostos gratuitamente: a plataforma negou falha de segurança nos seus sistemas e informou que os dados adquiridos são informações disponíveis publicamente nos perfis dos usuários.
Dados de 533 milhões de usuários do Facebook vazam: o Canaltech também noticiou essa semana o vazamento de mais de meio bilhão de usuários do Facebook, que por sua vez se pronunciaram essa semana e confirmaram o uso de web scraping.
A Evidently é uma empresa que oferece soluções open-source de monitoramento e análise, e elas também fizeram esse post muito interessante sobre os desafios que é colocar ML no mundo real e a importância de estar sempre monitorando sua performance. (em Inglês)
Se você está procurando por uma boa fonte para consultar e começar a implementar MLOps na sua empresa, você está no lugar certo! Esse repositório incrível contém dicas sobre ferramentas, blog posts, palestras e muito mais pra você consumir. (em Inglês)
Feedback Loop é um dos conceitos mais importantes quando estamos modelando produtos de ML, principalmente quando tais modelos podem ser muito enviesados por features sociais, como algoritmos de análise de crédito ou reincidência criminal. Esse artigo explica em detalhes o que é Feedback Loop e alerta para os perigos que eles podem trazer. (em Inglês)
Se você, assim como eu, é muito fã do canal do
, com certeza já ficou fascinado pelas
que eles fazem com fórmulas matemáticas. A boa notícia é que você também pode começar a fazer essas animações imediatamente e, melhor de tudo, usando Python. A biblioteca Manim foi criada pelo próprio Grant Sanderson (criador do canal) e forkeada pela comunidade, que deixou ela mais estável. Esse tutorial te ensinará como baixar e usar essa linda ferramenta. (em Inglês)
O Kubeflow é um poderoso toolkit para Machine Learning e sua nova versão vem com diversas novidades. Se você nunca mexeu com Kubeflow, mas tem interesse, aproveite esse artigo para conhecer as últimas novidades e como começar a utilizá-lo. (em Inglês)
VAGAS DA SEMANA
Perfil analítico
Excel intermediário;
Habilidades de comunicação e apresentação;
Interesse em aprender SQL e usar no dia a dia;
Estar se graduando em área técnica (Tecnologia, Negócios, Matemática, Economia, etc).
Community Assistant - Data Hackers (última semana)Belo Horizonte - MG ou RemotoPart-time Job - 20h semanais Sim! Essa é uma oportunidade para trabalhar no Data Hackers de forma remunerada A função será ajudar na organização da comunidade, tarefas administrativas, contato com os parceiros e fornecedores etc Ou seja, atuar em diversas frentes que vão ajudar a comunidade a crescer ainda mais rápido
Essa semana a Netflix lançou um documentário incrível em parceria com a Joy Buolamwini sobre os viéses e falhas que tecnologias de reconhecimento facial possui. Pra quem não conhece, a Joy foi responsável por um dos artigos mais incríveis que já li: Algoritmos não são racistas. Sua pele que é muito escura, contando um pouco da sua própria experiência com esses modelos enviesados. (Legendado em Português)
Dica do Data Hacker Flávio Clésio no nosso
.
Como fluem os rios brasileiros (GIF)Esse trabalho da página do Arvoreagua no Instagram e compartilhado pelo perfil Geopizza no Twitter mostra como os principais rios brasileiros fluem. O destaque na imagem fica pro Rio Doce, cujo a cor marrom é devido ao desatre ambiental pela Samarco (joint venture da Vale e BHP) que houve em Mariana, em 2015. (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
Estarei palestrando nessa edição do Data Train. Nos vemos lá!
15 de Abril - 19h - Evento Gratuito e 100% Online
21 e 22 de Abril - 9 AM (PDT) - Evento Gratuito e 100% Online
29 de Abril - Evento Gratuito e 100% Online
08 a 16 de Julho - Evento Gratuito e 100% Online
17 a 19 de Agosto de 2021 - Evento Pago e 100% Online