- Data Hackers Newsletter
- Posts
- 20+ palestras de Data Science, Machine Learning e Big Data 😃
20+ palestras de Data Science, Machine Learning e Big Data 😃
Como migrar um Data Lake monolítico para um pipeline de dados distribuídos
Na última semana rolou em São Paulo o evento PAPIs, o mais completo evento de machine learning do Brasil, reunindo pessoas de todo o mundo, incluindo muitos Data Hackers (alguns deles você pode ver na foto abaixo).Obs: Não confundam o Paulo Vasconcellos (um dos fundadores do Data Hackers) com o Poderoso Chefão.
O evento foi sensacional e contou com palestras de empresas de diversas partes do mundo, mas infelizmente elas ainda não foram divulgadas no site oficial do evento. Mas se você não pode ir ao evento, não fique triste, temos uma surpresa para você!Já conseguimos os slides de 2 palestras do evento:Slides 1 - I know what you did last session - Clustering users with MLSlides 2 - Training and deploying ML models with Kubeflow and TensorFlow Extended (TFX)Além disso você pode assistir na integra a mais de 20 palestras da última edição do evento acessando esse link.Obs: você pode até assistir ao evento completo.Na newsletter de hoje ainda tem mais: Aprenda como combinar Python, Power BI e Google Sheets para criar visualizações de dados incríveis; Saiba como a equipe de Data Science da Magalu atua; Aprenda a utilizar o Apache Kafka passo a passo; Entenda porque é importante migrar de um Data Lake monolítico para um pipeline de dados distribuídos; Veja como fazer análise de sentimentos com Python e muito mais!
O Data Hacker Thiago Manke, da Social Good Brasil, fez um tutorial incrível de como obter dados, salvar e visualizar, tudo usando as ferramentas mais simples e discutidas no mundo de análise de dados: Power BI, Google Sheets e Python!Thiago, que aprendeu a programar tem só 3 meses, escreveu esse post pra gente, que dá uma mão tremenda pra quem está começando agora e não sabe bem qual o primeiro passo. Olha que contribuição bacana!Se também quiser contribuir, não deixe pra depois! Leia nosso guia e descubra como :)
O LuizaLabs é o laboratório de inovação e tecnologia da Magalu - antiga Magazine Luiza -
eles contam como utilizam Ciência de Dados no dia a dia, falando sobre a organização das equipes, escopo de atuação e como Estatística, Data Science e Machine Learning se complementam. (em Português)
Nessa série de posts, o Data Hacker Gilson Filho vai mostrar um passo a passo de como atuar com o barramento de um grande volume de mensagens utilizando o Apache Kafka. Um conteúdo valioso tanto para quem está querendo aprender mais sobre essa abordagem quanto para quem já a utiliza e quer aprimorar os conhecimentos. (em Português)
Nesse post (que mais parece uma verdadeira aula) Zhamak Dehghani explica os principais detalhes referentes a uma arquitetura de dados moderna e debate sobre a necessidade de migrar os Data Lakes monolíticos para pipelines de dados distribuídos. (em inglês)
Se você sempre teve curiosidade para entender como os cientistas de dados conseguem utilizar algoritmos para interpretar textos e descobrir os sentimentos deles, esse post vai poder te ajudar. Em menos de 10 passos, Wesley Watanabe mostra como utilizar a lib NLTK para extrair os sentimentos de um conjunto de textos. (em português)
Trabalha na área de Marketing e sente falta de algum conteúdo mais aplicável a sua realidade? Esse post é para você! Aprenda como fazer um dashboard integrando algumas das ferramentas mais utilizadas na área de marketing e comece a fazer análises em tempo real. (em português)
Chegou até aqui e ainda gostaria de se aprofundar mais? Essa lista contém os 10 artigos de machine learning que tiveram maior destaque recentemente. Prepare-se para encarar muitos artigos envolvendo visão computacional, CNNs, Deep Reinforcement Learning e muito mais. (em inglês)
Machine Learning from zero to Hero - Google I/O 2019Nessa palestra que fez grande sucesso no evento Google I/O desse ano, Laurence Moroney e Karmel Allison explicam os principais conceitos de machine learning de uma forma que fica extremamente fácil compreender. Esse é mais um daqueles vídeos para assistir várias e várias vezes! (em Inglês)
VAGAS DA SEMANA
Graduação em Matemática, Estatística ou áreas correlatas
4+ anos de experiência em data analytics, BI ou áreas relacionadas
Conhecimento em ferramentas de Dataviz (BIME, Tableau, GoodData)
Excel avançado
SQL avançado
Ensino Superior em exatas ou áreas correlatas
Perfil analítico
Habilidade em Storytelling e Data Vizualization
SQL
Os direitos das pessoas homossexuais ao redor do mundoNas semanas em que a luta por direitos iguais vem ganhando cada vez mais destaque, nada melhor que um artigo (totalmente baseado em dados) sobre o assunto para termos a visão de como são tratados os direitos das pessoas homossexuais ao redor do globo. (em português)
Kepler é uma ferramenta open source desenvolvida pela Uber para facilitar a ánalise de dados geoespaciais. A ferramenta tem um visual incrível e diferentes funcionalidades.
você pode aprender a utilizar o Kepler em um Jupyter Notebook.
Ferramenta que promete facilitar a criação de visualizações de dados incríveis. Possui diversas opções de infográficos dinâmicos para atender diferentes necessidades.
PRÓXIMOS EVENTOS E MEETUPS
03 de julho de 2019
São Paulo/SP - Gympass (auditório térreo) - Gratuito
*Obs: Fila de Espera
30 e 31 de julho de 2019
16 Talks + 6 Workshops - Gratuito
08 e 09 de outubro de 2019
Curitiba/PR - A partir de R$ 390