Conheça o mais importante modelo de ML da década

A Thoughtworks é a nova parceira do Data Hackers e traz um evento incrível Aprenda definitivamente o que é MLOps

Fala Data Hackers, preparados para mais uma semana cheia de dados? O destaque dessa semana vai para o BLOOM: um modelo de linguagem à lá GPT-3 que está dando o que falar. Um dos destaques desse modelo é o grande suporte a outras linguagens, a quantidade de pessoas envolvidas e, claro, o fato dele ser totalmente open-source. Confira ainda nessa news mais detalhes sobre esse avanço.Mas não para por aí, além desse tópico temos vários outros assuntos interessantes:

A nossa querida Thoughtworks é a mais nova parceira do Data Hackers! Estamos muito animados com essa nova parceria, onde vamos criar uma série de conteúdos com a TW sobre a área de dados e Machine Learning. Então espere podcasts, blogposts e outros conteúdos que vão contar tudo sobre como a TW impacta o mundo.A propósito, no começo de Agosto irá rolar o XConf Brasil: uma conferência de tecnologia realizada pela TW, que trará gigantes da indústria para discutir o impacto do software no mundo. Aproveite para se inscrever logo no evento e não perder essa oportunidade! (em Português) 

Uma das iniciativas mais incríveis que já vi finalmente saiu do forno! O projeto BigScience, idealizado pelo Hugging Face e que juntou mais de mil pesquisadores ao redor do mundo, anunciou a criação do BLOOM: um modelo de linguagem (semelhante ao GPT-3) totalmente open-source!Um dos maiores destaques desse feito está em incluir muitas outras linguagens, diferente do Inglês. Para se ter uma ideia, para os idiomas Espanhol, Francês e Árabe, o BLOOM é o maior modelo já feito na história. Se você quiser brincar com o BLOOM direto do navegador, pode acessar o site do Hugging Face e mandar ele escrever alguma (em inglês).

MLOps está entre nós e isso é inegável. Mais e mais será necessário conhecer e entender como que essa nova área em AI funciona. Para te ajudar a entender tudo sobre a área de uma forma bem didática, Cora Silberschneider traz esse post completo falando desde o que é e como identificar o nível de maturidade de MLOps da sua empresa. (em Português)

 

Essa semana, a OpenAI anunciou que seu modelo de geração de imagens, o DALL-E, entraria em fase beta. Isso quer dizer que mais de 1 milhão de pessoas que estiverem na sua lista de espera receberão acesso a desejada AI. Eu já recebi o meu acesso e

algumas imagens que estou criando lá.

e já pedir seu acesso também (em Inglês)

Obrigado a todos que colaboraram com incríveis análises para o State of Data! Abaixo você pode conferir os 10 finalistas do State of Data Brazil que estão concorrente aos três prêmios incríveis da competição:Júlio CesarEdson R. BarbosaFábio Junior DamacenaDavi Ribeiro dos SantosRafael AssisNicholas Marino

Vinicius Duzac Cerutti

Fellipe GomesHayala Cavenague

Luiz SimõesParabéns aos finalistas! A próxima e última etapa do State of Data Brazil ocorrerá no dia 11 de Agosto, onde faremos uma live para anunciar o primeiro, segundo e terceiro lugar da competição. Até lá!

Há algumas semanas, falamos aqui na news sobre a notícia do engenheiro da Google, Blake Lemoine, que dizia que a AI deles, a LaMDA, possuía consciência. Após ser afastado, o último capítulo dessa novela foi a demissão de Blake do Google. (em Português)

O GPT-3 é um dos modelos de linguagem mais famosos que tem atualmente, e ele continua surpreendendo com suas possibilidades. Nesse post, Simon Willison explica seus experimentos que conseguem fazer com o GPT-3 explique de forma bem efetiva como códigos de programação funcionam (em Inglês)

Um post bem legal do KDnuggets explicando brevemente alguns dos mais comuns algoritmos usados em Machine Learning. (em Inglês)

A Stitch Fix é uma das maiores referências em uso de ML para alto impacto. Eles publicaram esse post falando sobre como foi a experiência em criar sua própria plataforma de Machine Learning, destacando os desafios e escolhas de arquitetura. (em Inglês)

Como desenvolvedores se preparam para entrevistas (humor)Um vídeo bem-humorado pra você começar bem a semana. Qualquer semelhança com a realidade é mera. coincidência (ou não). (em Inglês)

VAGAS DA SEMANA

  • +2 anos de EXP

  • Estatística

  • Machine Learning

  • SQL

  • Python ou R

  • Spark

  • Git

  • Estatística

  • Python ou R

  • EXP. com ferramentas de cloud para ML

Apenas use SQL. Vai por mim

Confira essa incrível vis mostrando como e quando os seres humanos domesticaram animais, a começar com os doguinhos, que foram domesticados há mais de 10 mil anos (em Inglês)

Data Train: Modelos de QA com Deep Learning e Data Platform - Data Lake25 de Julho - Evento Gratuito e 100% OnlineData for Breakfast: um evento da Snowflake28 de Julho - Evento Gratuito e 100% Online

Data Universe - 5ª Edição08 e 09 de Agosto - Evento Gratuito e 100% OnlineXConf Brasil, o evento de tecnologia da Thoughworks17 de Agosto - Evento Gratuito e 100% OnlineCoalesce: The Analytics Engineer Conference17 a 21 de Outubro - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.