- Data Hackers Newsletter
- Posts
- 10 truques de Pandas para aumentar sua produtividade 🐼
10 truques de Pandas para aumentar sua produtividade 🐼
A Hierarquia de necessidades de Machine Learning
Fala, Data Hacker. Seja bem-vindo a mais uma newsletter! Nessa semana, nós iremos te dar dicas sobre como aumentar sua produtividade utilizando Pandas, apresentar o que é o Amazon DeepRacer e até lhe dizer quem é o melhor cantor de música pop da atualidade. Vamos lá?
Na última semana, aconteceu na sede do EBANX o Meetup e Bootcamp do Data Hackers! Foi um evento incrível, com uma turma sensacional que acompanhou durante dois dias seguidos um treinamento que ensinou as principais técnicas de Data Science e Machine Learning. Você pode conferir um pouco como foi o evento nas fotos acima.
O Pandas é uma mão na roda quando o assunto é tratamento e manipulação de estruturas de dados. Nesse tutorial, você irá aprender alguns truques fará seu trabalho com essa ferramenta ser cada ver mais produtivo. (em Inglês)
Web Scraping (ou Raspagem de Dados, ou Raspagem Web) é uma técnica que permite que você colete e transforme páginas web. Por exemplo, com essa técnica, você conseguirá extrair tabelas diretamente de páginas web, ou selecionar apenas alguns elementos que queira coletar, etc.
O Data Hacker
fez esse artigo irado no Medium do Data Hackers que irá te ensinar a utilizar essa técnica. (em Português)
Durante o Amazon re:Invent do ano passado (evento anual da Amazon para anunciar novos produtos) eles apresentaram o DeepRacer: um carro autônomo que você pode programar com Inteligência Artificial. Durante nossa visita a sede do EBANX, nós conhecemos o primeiro "carrinho" do Brasil, e foi incrível ver de perto essa ideia tão promissora. Se você quiser saber um pouco mais sobre o DeepRacer e seu potencial (vai rolar até liga de corrida), confira esse post da Amazon que conta tudo sobre ele. (em Inglês)
É bem provável que você já tenha ouvido essa frase em algum lugar, certo? Pois agora você pode entender um pouco mais sobre isso. Nesse post escrito pelo Prof. Adam Kelleher, ele explica que Testes AB não são a única forma de validar essa ideia. (em inglês)
Já ouviu falar em Hierarquia de Necessidades de Maslow? É aquela pirâmide que mostra todas as necessidades que o ser humano tem, que vão desde necessidades fisiológicas (comer, dormir,...) até coisas abstratas, como criatividade e realização pessoal. Já parou para pensar como essa mesma hierarquia poderia ser aplicada a projetos de Machine Learning? Foi exatamente o que o Data Hacker
fez nesse post irado! Ele detalha todas as necessidades de um projeto de ML, que vão desde entendimento de regras de negócio até a criação do modelo em si. (em Português)
Logloss é uma métrica utilizada para avaliar modelos de Machine Learning. Diferente de outras métricas, uma das caracterísitcas do Logloss é penalizar modelos que fazem previsões erradas. Nesse caso, um acerto tem um peso diferente no cálculo da acurácia do que um erro. Contudo, as vezes pode ser um pouco difícil de interpretar os resultados, mas esse post promete te ajudar nisso. (em Inglês)
Building Data Science Teams (Gratuito)Essa é uma dica de livro para àqueles que querem saber como estruturar um time de Data Science. Escrito por ninguém menos que Dj Patil (criador do termo "Data Scientist" e Cientista que ajudou Obama em sua campanha), esse livro irá te mostrar não só todas as aplicações possíveis de um time de Ciência de Dados (Marketing, Produtos, Suporte, Decision Science, etc.), mas também quais tipos de atribuições designar para cada profissional. (em Inglês)
VAGAS DA SEMANA
Tableau
Técnicas de estruturação de Data Lakes
SQL
Python
Gerenciamento de catálogo de serviços
Inglês fluente
Superior Completo
Modelagem de dados
SQL
Data Warehouse
AWS
Inglês Fluente
Ferramentas de BI (QuickSight, por exemplo)
Quem é a maior estrela do pop?Segundo o Billboard (uma das maiores e mais antigas revistas sobre indústria musical), músicos como Ed Sheeran e Taylor Swift foram os músicos mais populares de 2018. O problema é que nenhum deles lançaram um album em 2018. Será que esse ranking realmente representa a cultura musical? É isso que esse post do The Pudding quer responder. (em Inglês)
PRÓXIMOS EVENTOS E MEETUPS
20 de Março de 2019
Social Miner - São Paulo/SP - Grátis
21 de Março de 2019
MaxMilhas - Belo Horizonte/MG - Grátis (Lista de espera)
29 e 30 de Abril de 2019
Maracanã - Rio de Janeiro/RJ - Grátis