• Data Hackers Newsletter
  • Posts
  • NLP: Como utilizar Data Science para analisar e compreender textos, criar sistemas conversacionais e fazer a diferença com essas técnicas! 🔠

NLP: Como utilizar Data Science para analisar e compreender textos, criar sistemas conversacionais e fazer a diferença com essas técnicas! 🔠

Você sabe qual o papel do BA (Business Analyst) numa equipe de dados?

Hoje vamos falar de um dos assuntos mais "hypados" da área de dados, o processamento de linguagem natural ou NLP.Talvez falando assim você não entenda que se trate de um assunto tão popular, mas ele é uma das áreas que mais crescem dentro do universo dos dados. Seja em pesquisas e artigos científicos ou até mesmo em aplicações na indústria, como por exemplo a famosa Alexa da Amazon, ou as casas automatizadas que respondem a comandos humanos. "OK Google, abaixe a temperatura do ar condicionado e me faça um café".Pensando nisso decidimos convidar alguns especialistas no assunto e gravar um episódio do nosso podcast sobre o tema. O resultado final ficou super divertido e repleto de conhecimentos na área.Além disso tem mais! Vamos mostrar pra vocês como um Business Analyst atua dentro de uma equipe de dados e como esse papel é importante, vamos dar dicas de arquitetura de dados no Airbnb e Facebook, falar sobre como é possível aplicar técnicas de DS na retenção de talentos, falar sobre Python, Notebooks, busca de emprego e ferramentas de ML.  No final como de costume vamos compartilhar memes, exemplos de data visualization, vagas de emprego e eventos (gratuitos e online).Tem muito conteúdo, dicas incríveis e muita coisa feita pelos próprios integrantes da comunidade, não deixe de prestigiar!

Muita gente nem imagina que técnicas de Machine Learning que utilizamos para analisar dados podem também ser utilizadas para analisar textos, e que existe uma área do conhecimento enorme por trás disso e que vem crescendo cada dia mais.A área de processamentos de linguagem natural (Natural Language Processing - NLP) é um dos campos que mais estão crescendo e sendo aplicados em AI e Data Science. Nesse episódio decidimos entrar de cabeça nesse assunto altamente importante para quem precisa lidar com dados de texto e voz. Para esse episódio convidamos Flávio Clésio — Machine Learning Engineer na MyHammer — , e Ahirton Lopes — PhD Student no Mackensie e Data Scientist na Magna Sistemas — para que eles possam nos contar como tem sido a experiência deles aplicando NLP na indústria e academia.

Lembrando que você pode encontrar o podcast do Data Hackers no SpotifyiTunesGoogle PodcastCastbox e muitas outras plataformas. Caso queira, você também pode ouvir o episódio aqui no post mesmo!. (em Português)

Um problema que está cada vez mais frequente em equipes de dados é o baixo volume de iniciativas que chegam de fato a gerar valor para as empresas, cerca de 87% dos projetos nunca chega a ir para produção. 

Algumas empresas estão conseguindo inverter esse número e para isso estão contando com a ajuda de um novo papel no time de dados o Business Analyst. Nesse artigoé possível entender mais sobre esse papel e o que o torna tão diferente de um analista ou cientista de dados.

(em Português)

 

Se você trabalha com dados em qualquer empresa que tem um grande volume de informações para ser analisada, já deve ter se deparado com termos como, Data Warehouses, Pipeline de Dados, Data Lakes, Schemas etc. Existem diversas soluções diferentes, que são utilizas em conjunto para criar uma arquitetura de dados e esse post mostra exemplos das abordagens que o Facebook e Airbnb utilizaram em sua arquitetura. (em Inglês)

Precisando de ideias para levar soluções de Data Science para diferentes áreas da empresa? Que tal começar pelo RH? Nesse post super completo o Data Hacker Diego Alcade mostra, através de exemplos práticos, como as técnicas de Data Science podem ser utilizadas para ajudar as empresas a reter talentos. (em Português)

A Data Hacker Debora Gobbo acaba de divulgar a segunda parte de uma série de posts incríveis que ela fez. Dessa vez ela resolveu dar algumas dicas de ouro para quem ainda está se preparando para se tornar Analista de Dados (as dicas são tão boas que eu indico até mesmo para quem já atua na área) [

,

]. (em Português)

Não temos dúvidas que um dos pontos que geram mais dúvidas ao fazer algoritmos de clusterização são os parâmetros de distância, nesse post o Data Hacker Ricardo Pinto fala mais sobre o tema, com direito a um vídeo para facilitar ainda mais o entendimento (agora você não tem mais desculpa para não se aprofundar nesse ponto, combinado?). (em Português)

Tenho certeza que todos nós já cometemos muitos erros ao buscar o primeiro emprego. O que incluir no CV? Se eu ainda não trabalho, como posso ter experiência? Pensando nessas perguntas e em muitas outras o Data Hacker Vinícius Galvão resolveu compartilhar com a gente um pouco da sua experiência na busca pelo primeiro emprego. Nada melhor do que aprender com a experiência dos outros, certo? (em Português)

Você prefere Python ou R? E se você pudesse misturar Python, R e Scala no mesmo notebook? E se os scripts fossem todos unificados em um só ambiente e o estudo fosse feito de forma reproduzível, sem nenhum impacto para quem precisar refazer a análise no futuro? Se você ficou intrigado com essas perguntas vale a pena conferir esse artigo falando mais sobre esse framework incrível criado e disponibilizado pela equipe Netflix. (em Inglês)

Nesse artigo são comparadas as principais soluções de ML na nuvem da Amazon, Google, Microsoft e Databricks. No fim é apresentada uma tabela interessante com cada funcionalidade semelhante nas diferentes plataformas. (em Inglês)

VAGAS DA SEMANA

  • Gestão de pessoas

  • Desejáfvel experiência com BI, Big Data ou Data Science

  • Perfil empreendedor, estratégico e analítico

  • Abordagem rigorosamente analítica e orientada por métricas para a resolução de problemas 

  • Excelente capacidade de comunicação

  • Inglês avançado

  • Experiência com gestão de times de Data Engineering, Analytics, Data Science ou BI;

  • Experiência aprofundada no desenvolvimento de soluções de problemas de negócio com base em estruturação e uso de dados;

  • Desenvolvimento de software em pelo menos uma linguagem de programação;

  • Conhecimentos avançados no uso de SQL e em banco de dados relacional;

  • Conhecimento profundo em pelo menos uma ferramentas de ETL;

  • Familiaridade com modelagem de Data Warehousing para consultas de ferramentas de análise de dados;

Dessa vez o Mário Filho resolveu fazer um bate papo descontraído onde o assunto foi "Gestão de Equipes de Dados e Analytics". Nessa conversa Mario Filho e o Lages falaram sobre o momento certo de começar a formar um time de dados, formato de equipes, carreira em Y, contratação e dos principais desafios e perrengues que os dois já passaram.  (em Português)

Fonte:

Como a pandemia está afetando o mercado de trabalho nos USAApós seguidos meses de tentativas de isolamento social, disputa política e avanço do COVID-19 o mercado de trabalho nos USA certamente já não é mais o mesmo. Na tentativa de analisar melhor como a pandemia tem afetado o mercado de trabalho a equipe do Reuters criou esse artigo recheado de visualizações de dados interativas, é muito interessante ler o artigo para entender melhor o impacto do vírus na economia e ainda se inspirar com vários exemplos práticos de dataviz.  (em Inglês)

PRÓXIMOS EVENTOS E MEETUPS [100% ONLINE]

11 de agosto de 2020 - Evento online gratuito

12 de agosto de 2020 - Evento online gratuito

24 e 25 de Agosto de 2020 - Evento online gratuito

30 de Novembro a 18 de Dezembro de 2020 - Evento online gratuito