O relatório do State of Data Brazil 2023 está no ar!

E mais: Como entrar na área de análise de dados; Pesquisadores propõem IA que usa áudio para fazer foto cantar e falar; Como gerar e usar dados sintéticos para o aprendizado de modelos.

Fala, Data Hackers!

Hoje é um dia muito especial para nós: trazemos o resultado da pesquisa State of Data Brazil 2023 em primeiríssima mão para você! Confira o relatório completo com o maior mapeamento sobre a área de dados já feito no Brasil, elaborado com as respostas de mais de 5.290 profissionais da área.

Além disso, temos ainda dicas para quem quer migrar para Análise de Dados, um modelo de IA que com um áudio faz fotos falarem e cantarem, além de um guia de como gerar dados sintéticos para o aprendizado de modelos.

Confira outros destaques dessa edição:

O relatório da maior e mais completa pesquisa já feita sobre o mercado brasileiro de dados está no ar! Realizada pela comunidade Data Hackers com o apoio da Bain & Company, a State of Data Brazil 2023 contou com as respostas de mais de 5200 profissionais para traçar um panorama da área de dados no Brasil.

Esse ano, além do relatório completo da Bain & Company, nós criamos um site com os principais destaques da pesquisa, para que você possa conferir em primeira mão e compartilhar os resultados. Esse é apenas o começo das novidades que temos para esse ano. Estamos preparando algo bem legal para te ajudar a impulsionar sua carreira. Fique ligado no Data Hackers para não perder nada!

Muita gente pensa em migrar para a área de Análise de Dados, que é a que mais tem crescido em nosso ramo e parece ter o maior número de vagas abertas. Mas, como toda mudança de carreira, esse processo envolve muitas dúvidas, do ponto inicial dos estudos até o momento de começar a se candidatar para vagas.

Neste artigo, a analista de dados Tássia Giovanelli, que inclusive já participou do podcast Data Hackers (confira aqui), conta como entrou na área, dá a trilha dos primeiros passos e dicas do que levar em conta ao planejar sua jornada de aprendizado. (em Português)

Pesquisadores chineses ligados ao grupo Alibaba propuseram uma IA capaz de, com um áudio, fazer uma foto falar e cantar usando expressões faciais extremamente realistas.

A IA recebeu o nome de EMO: Emote Portrait Alive, e tem seu funcionamento detalhado neste artigo, que traz ainda vários vídeos de demonstração da tecnologia. (em Inglês)

Dados sintéticos não são apenas uma alternativa viável e mais barata aos dados anotados por humanos: são também extremamente eficazes. Muitas das LLMs que temos atualmente se beneficiaram de dados gerados por máquina para ter um aumento de qualidade.

Nesse post de Eugene Yan, ele detalha algumas das principais técnicas para gerar e usar dados sintéticos. (em Inglês)

A comunidade Data Hackers estará presente no evento CDOIQ, um dos maiores eventos do Brasil com o foco em alta liderança de times de dados.

O evento vai acontecer na FIAP em São Paulo, no dia 12/03/2024 e contará com o apoio da nossa comunidade, incluindo um momento ao vivo para debater assuntos em alta sobre o mercado de trabalho em dados no Brasil.

Se você lidera equipes de dados não perca a oportunidade de participar desse evento e de se juntar aos líderes de dados das principais empresas do Brasil para discutir sobre o impacto dos dados nos negócios.

 

OUTROS TÓPICOS

”Você acabou de dizer algo errado sobre regressão logística”
Erros ao falar sobre regressão logística são mais comuns que se pensa, afinal é um assunto desafiador e cheio de nuances, do que todos precisamos aprender ou reaprender algumas coisas de tempos em tempos. Aqui, o cientista de dados Demetri Pananos ensina como interpretar coeficientes do algoritmo. (em Inglês)

Todas as decisões de infraestrutura que tomei em quatro anos (e se as endosso ou me arrependo)
Nada melhor que aprender com o erro dos outros, não? Nesse post, Jack Lindamood conta como foi sua experiência ao trabalhar com infraestrutura em ambientes de startup e reavalia hoje as decisões que tomou ao longo dos últimos quatro anos. (em Inglês)

A estratégia de governança de IA que você já deveria ter
Desde o lançamento do ChatGPT, o uso de IA transformou a forma como os engenheiros de software trabalham com uma velocidade estonteante. Mas nem tudo são flores: a IA também trouxe uma série de riscos que precisam ser considerados, e há estudos que mostram que menos de um terço das empresas tem uma política de governança de IA. Este artigo apresenta pontos de partida e questões a serem consideradas para a criação de políticas nesse sentido. (em Inglês)

Stability lança Stable Diffusion 3, mais poderoso e com mais controle
Na semana passada foi anunciado o lançamento do Stable Diffusion 3, nova geração de modelos de IA para geração de imagens da inglesa Stability AI. O Stable Diffusion 3 promete competir com o Gemini do Google, o DALL-E da OpenAI e o Midjourney, e seus parâmetros variam de 800 milhões a 8 bilhões, permitindo que ele rode em vários dispositivos, de smartphones a servidores. Não houve demonstração, mas a Stability AI abriu uma lista de espera para quem quer testar o modelo. (em Inglês)

DICA DE VÍDEO

Andrej Karparthy é figura conhecida no mundo da IA. Ele foi responsável por criar o piloto automático da Tesla, e é nada menos que um dos cofundadores da OpenAI. Nesse vídeo, ele dá uma verdadeira masterclass sobre como funcionam tokenizers, que são a espinha dorsal das LLMs. A didática de Andrej e a profundidade do conteúdo fazem deste vídeo um dos melhores materiais sobre deep learning que eu já vi! (em Inglês)

VAGAS DA SEMANA

Remoto

  • Proficiência em Python e SQL para análise de dados;

  • Ter trabalhado com computação em nuvem (GCP, AWS, Azure);

  • Experiência com manipulação de grandes volumes de dados;

  • Sólido conhecimento de técnicas estatísticas (distribuições estatísticas, testes de hipótese, estatística multivariada e outros);

  • Experiência em técnicas de Machine Learning (classificação, regressão, séries temporais e outras);

  • Conhecimento em versionamento de código (git);

  • Graduação em Ciência de Dados, Estatística, Matemática, Ciência da Computação ou Engenharias.

Belo Horizonte-MG - Presencial

  • Graduação em Estatística, Matemática, Ciência de Dados, Engenharias, Física, Economia ou correlatas, ou experiência prática equivalente;

  • 5 anos de experiência em aplicações de análises (extração de insights, realização de análises estatísticas ou resolução de problemas de negócios) e programação (Python, R, SQL);

  • Capacidade de se comunicar fluentemente em português e inglês;

  • Experiência com designs experimentais avançados, incluindo testes A/B (diferencial);

  • Excelente capacidade de resolver problemas, gerenciar projetos e se comunicar de forma oral e escrita (diferencial).

MEME DA SEMANA

IA ainda não faz milagre, galera.

DATA VISUALIZATION DA SEMANA

Todos sabemos que unicórnios é a forma como são chamadas as Startups avaliadas em mais de um bilhão de dólares antes de abrir seu capital na bolsa, mas você já se perguntou como estão os unicórnios brasileiros atualmente, depois da seca de investimentos que enfrentamos desde 2022? Quais deles vem contratando e quais vêm demitindo funcionários, e no geral há mais contratações ou demissões? Confira nesse levantamento feito pela plataforma Sling Hub abrangendo os últimos dois anos. (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS

CDOIQ LATAM 2024
12 de março - São Paulo-SP (ou online)

Open Data Day Recife
(inscrições abertas para palestrantes aqui)
2 a 8 de março - Recife-PE

Big Data Brazil Experience 2024
16 de novembro - São Paulo-SP

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Wow! Já que chegou até aqui, qual a nota dessa edição da Newsletter?

Pode dar sua opinião sincera...

Faça Login ou Inscrever-se para participar de pesquisas.

Logo