3 Erros comuns de todo profissional de dados 😅

Como é trabalhar na Amazon? Os melhores projetos de dataviz de 2021

Fala, Data Hackers! Que saudade eu estava de vocês! Ano novo, vida nova? Que vamos aprender sobre o mundo de Dados esse ano? Pra iniciar, levantei aqui um relato de um dos mestres da comunidade, o Fernando Talietta fez um artigo pro nosso blog bem bacana: uma lista de 3 erros muito comuns de profissionais, juniores ou seniores, da área de Dados.Nessa news a gente também traz novidades bem bacanas do mercado, retrospectivas de 2021 e vagas pra você entrar de vez no mundo de dados! E mais:

Ser um profissional de experiência não garante que estamos imunes a deslizes e decisões erradas na hora de começar uma análise de dados. O mestre Fernando Talietta, grande contribuidor do Data Hackers, escreveu esse artigo falando de 3 erros que ele comete e que maioria dos Cientistas e outros profissionais de dados cometem no seu dia a dia.Entre perda de produtividade, medos e receios de certas coisas e pouca preparação em um assunto muito importante, que sempre trazemos por aqui, Talietta dá dicas de como mudar o mindset e ser um Data Scientist melhor, sem ter que aprender N conceitos e ferramentas muito complexas. Veja! (em Inglês)

Trabalhar numa das maiores Big Techs do mundo é sonho de muita gente de tecnologia. Mas nem tudo são flores. Nesse relato muito bacana, o UX Designer Ben Adam conta como foi seu processo seletivo, como os times trabalhando dentro da gigante e quais são os motivos que podem levar a você ficar ou sair da companhia.

(em Inglês)

 

Uma das ferramentas que vem ganhando espaço pelo poder e facilidade de uso quando produtizar modelos de ML é o AWS SageMaker. O Data Hacker Ricardo Junior fez um guia muito bacana no nosso blog, explicando como que se usa o SageMaker Pipelines, módulo novo da plataforma que ajuda a produtizar fluxos de ML, com monitoramento e escala para qualquer workload de produção. Imperdível!  (em Português)

Em mais uma rodada, que não demorou mais de 3 meses da última, Airbyte, solução de coleta de dados baseada em open-source, levantou um round de 150 milhões pra evangelizar e disseminar o EL(T) no mundo de cloud. Nesse post, o time diz quais são os próximos passos nesse grande marco. Airbyte com esse valuation, começa a fazer par com DBT, ferramenta também muito adotada e que vem mudando o mercado de Data Engineering no mundo. (em Inglês)

2022 é um ano que promete no mundo de dados, principalmente quando o assunto é consolidar Data Platforms. A Prukalpa, Co-Founder do Atlan, ferramenta de Catálogo de Dados, fez esse post trazendo várias tendências que vão seguir forte nesse ano: Data Observability, ELT e Reverse ETL são temas que nunca ouviu falar? Então não perca esse texto! (Em Inglês)

VAGAS DA SEMANA

  • Domínio em Apache Airflow (ou outro orquestrador de pipelines);

  • Domínio em AWS Athena;

  • BDs na AWS: RDS, Redshift ou Aurora;

  • Python;

  • AWS SQS, Kafka ou Kinesis;

  • Domínio em Hadoop, MapReduce e Spark no EMR;

  • Arquiteturas de Big Data

  • Clouds (Azure, AWS e/ou GCP);

  • Python, Spark, Scala, Java, SQL;

  • Clusteres e processamento distribuído

  • Mensageria e Streaming

  • Git, CI/CD

3 Filmes para quem ama Dados!Dica muito legal do pessoal da Five Acts de 3 filmes para quem ama Dados. Todos eles disponíveis nas ferramentas de Streaming pra você assistir! (em Inglês)

Rapaz, até que deu saudade da época que dava pra montar sua própria máquina sem ter que vender um rim...

Um dos blogs mais interessantes de Data Viz do mundo fez um post contendo os melhores projetos do ano passado. De viz cômicas a Geo Plots lindos, só projeto massa! Confira! (em Inglês)