Por que projetos de data science falham

Uma visualização das empresas mais valiosas do mundo

Fala Data Hackers! Sejam bem-vindos a mais uma news! O destaque de hoje vai para um conteúdo brazuca muito legal falando sobre os principais motivos de falhas em projetos de data science. Um conteúdo muito importante para não cairmos em tais erros quando pensamos em novos projetos.Ainda, vale lembrar que a pesquisa do State of Data está chegando as fases finais, mas ainda dá tempo de clicar aqui e participar da pesquisa. Aproveite para compartilhar com seus amigos e colegas de área para continuarmos a fazer a maior pesquisa de dados do Brasil!Além disso, nessa news vamos falar também de:

Pesquisa State of Data Brazil 2022 está quase terminando! Não perca a oportunidade de contribuir com o maior projeto brasileiro para mapear o mercado de Dados no país. Compartilhe com seus colegas!

Um projeto de data science é capaz de falhar antes de você criar a primeira query SQL para extrair os dados. De falta de maturidade analítica a falta de habilidades, projetos de ciência de dados possuem características únicas que temos que tomar cuidado para não errar a mão. Nesse artigo, Thiago Farias traz uma análise sobre as principais causas que fazem projetos de dados não verem a luz do dia. (em Português)

O pessoal do EmCasa compartilhou esse post trazendo um pouco da experiência que foi evoluir sua estrutura de dados inicial, trazendo um pouco do ferramental e novos processos criados. (em Português)

 

Durante o Github Universe, a sua conferência, foi anunciado uma nova funcionalidade ao Copilot que vai permitir utilizar a voz para criar código. Enquanto isso é um grande passo de acessibilidade, o negócio é esperar para ver como vai funcionar na prática (ainda mais em Português, não é?). (em Inglês)

Quando falamos de varejo, a área de estoque e logística sempre são pontos que vira e mexe tentam automatizar mais e mais. Mas, parece que agora a briga ficou séria, com a Amazon anunciando um robô capaz de não só identificar, mas também manusear uma gama muito maior de produtos, que pode reduzir a necessidade de pessoal humano para essa tarefa. (em Inglês)

Uma camada semântica é a camada que traz os dados de forma que o negócio consiga entender, e com o passar do tempo a forma de criar essa camada mudou. Esse post do pessoal da Atlan traz um pouco dessa história, e como ferramentas como DBT estão atuando nessa camada. (em Inglês)

Uma das discussões mais comuns com o surgimento de AI generativas como DALL-E e Stable Diffusion está na automatização da criatividade, substituindo artistas em sua expertise.

traz uma visão interessante sobre essa nova era da criatividade, onde artistas devem olhar para tais ferramentas como potencializador de suas habilidades, e não seus nêmesis. (em Inglês)

VAGAS DA SEMANA

  • Superior completo;

  • Conhecimento em modelagem dimensional;

  • Conhecimento em cloud computing;

  • Python;

  • Spark;

  • SQL

  • Superior completo;

  • 3+ anos de EXP

  • Conhecimento em Machine Learning

  • Experiência com infraestrutura de dados

Dica do Agail Sanchez lá no nosso Slack

Mais uma visualização muito legal do pessoal da Visual Capitalist trazendo as empresas mais valiosas do mundo. (em Português)

SAMBA - Simpósio Acadêmico Multidisciplinar de Big Data Analytics23 e 24 de Novembro - Evento Híbrido - Gratuito para professores e alunos da rede públicaAWS Re:Invent28 de Novembro a 02 de Dezembro - Parte Online gratuita

Apply(recsys)6 de Dezembro - Online e Gratuito

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.