- Data Hackers Newsletter
- Posts
- As trolagens do Python 🐍
As trolagens do Python 🐍
WTF, Python! Pegadinhas da linguagem que você ama!
Ohayô, Unidos do Data Hackers! Não tem carnaval nas ruas, pra muitos não tem feriado, mas a newsletter mais amada da sua segunda, não falta!Nessa edição trouxemos um conteúdo bem engraçado e divertido no destaque: como que o Python pode nos pregar peças de cair o queixo! Sim, nossa linguagem tão amada, apesar de simples e fácil de aprender, pode nos enganar, justamente pelas facilidades, como tipagem fraca, interpretação e passagem de parâmetros por referência.E mais: Cortando 85% de custos no pipeline com AWS Athena, usando Jupyter no Docker, como o Samba é visto como dados, vagas muito legais, o meme da semana e muito mais!
O Python é uma linguagem muito divertida e fácil de aprender, isso ninguém discute. Mas, como várias linguagens interpretadas com tipagem mais fraca - pra quem ouve podcast, já sabe que pego no pé do javascript nesse sentido -, o Python tem suas "loucuras"! Dica do Data Hacker Fernando Talietta, aka Adamastor, no nosso Slack, esse repositório compila as peças que a linguagem que mais amamos - dirão que há divergências, né Lages? - (em Português)
O Airbnb há anos tem dado grandes contribuições para mundo open-source dos dados. Dois projetos muito famosos, Superset e Airflow, foram criados lá e eles continuam como grandes contribuidores. Nesse artigo, o time de analytics do Airbnb mostra as features como cache de dados e - o mais legal, na minha opinião - a inclusão de widgets para dashboards! Que, por sua vez, são "embedados" dentro do Dataportal, o grande catálogo de dados da empresa. Muito bacana! (em Inglês)
Manter um pipeline de dados durante anos é uma tarefa árdua. Nos últimos anos, ao invés de pipelines gráficos ou as famosas Stored Procedures, vimos um grande crescimento de pipelines usando código, principalmente Java, Python e Scala. Nesse post sensacional, a galera do time de Eng. de Dados do QuintoAndar, resume como tem aplicado os conceitos do Clean Code,
, em seus ETLs, garantindo facilidade em manutenção e entendimento. Imperdível para qualquer time de Data Engineering. (em Inglês)
Um pipeline de dados em uma grande empresa, mesmo com todos as features de uma cloud! Nesse post muito interessante do Blog da AWS, a EMX conta como ela utilizou Airflow com Athena para reduzir drasticamente seus gastos com seu pipeline, dando de quebra escalabilidade e facilidade de uso. (em Inglês)
É comum ter que ter vários ambientes, com diferentes configurações para cada projeto que você tem no Jupyter. Nesse post muito bacana, o Data Hackers Augusto Herrmann ensina como usar o nosso amigo Docker para controlar tais ambientes e ter seus ambientes facilmente separados para desenvolver em Python no Jupyter. (Em Português)
VAGAS DA SEMANA
Experiência relevante em SQL e Python;
Conhecimentos Avançados em ML e Estatística;
Domínio de PySpark;
XP com versionamente de código (Github);
Nuvem Azure;
Inglês intermediário.
Ensino superior em exatas e/ou engenharia
Experiência relevante com alguma linguagem de programação
Conhecimento intermediário/avançado de SQL
Desejável XP em ETL e Python
Gradiente descendente? Nunca nem vi...
O Carnaval não está nas ruas e a Sapucaí está vazia. Mas que tal dar uma olhada no que as letras do samba tem nos passado durante esses anos de música e cultura? O site Léxico do Samba compilou anos de letras em belas visualizações de dados, que dão um descritivo de como os sambistas aproveitam a riqueza de nossa linguagem para se manifestarem musicalmente. (em Português)
PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]
30 de Março a 01 de Abril de 2021 - Evento Pago e 100% Online
17 a 19 de Agosto de 2021 - Evento Pago e 100% Online