Cientista de Dados em 6 meses ganhando R$ 5mil? MENTIRA!😡

Um glossário para pessoas normais entenderem termos impossíveis criados por estatísticos Os melhores "Cheatsheets" em Data Science disponíveis para download gratuito

Fala Data Hackers, prontos para mais uma semana que já começa cheia de dados?Para começar bem, que tal falarmos da mais nova polêmica que agitou as redes sociais essa semana, onde alguns influenciadores embarcaram na hype da área de tecnologia e acabaram afirmando que atualmente é fácil entrar para a área estudando 6 meses e ganhando R$ 5mil como salário inicial.Bom, para fazer jus ao nome e objetivo da comunidade, aqui no Data Hackers acreditamos em um lema: "Sem dados você é apenas uma pessoa qualquer com uma opinião" Diante disso, para tentar esclarecer o quanto de verdade tem nessa polêmica convidamos 2 especialistas da Bain & Company para juntos aprofundarmos nos números da pesquisa State of Data Brazil e entender a fundo o mercado de trabalho de dados, explorando assuntos como salários, carreira, senioridade, trabalho remoto e muitos outros pontos. Esse é o tema do mais novo episódio do Data Hackers Podcast.Depois de ouvir o episódio, você mesmo pode baixar o relatório e tirar suas próprias conclusões (obviamente baseadas em dados!).Além disso temos outros tópicos quentes para atualizar sua semana:

Na última semana anunciamos aqui na Newsletter os resultados da State of Data Brazil, uma pesquisa que mapeou o mercado de dados brasileiro, feita pelo Data Hackers em parceria com a Bain & Company.Um dos maiores benefícios da pesquisa State of Data Brazil é dar pra comunidade o poder de entender os detalhes do mercado de trabalhos da área de dados, e com isso tirar suas próprias conclusões sobre salários, carreira e muitas outras coisas.Dando mais um passo nessa direção de democratizar os dados, decidimos convidar o Lucas Brossi e Felipe Fiamozzini da Bain & Company para participar do Podcast do Data Hackers e compartilhar com a comunidade as principais conclusões da pesquisa, destacando os pontos mais importantes e polêmicos que encontramos explorando dos números.

Lembrando que você pode encontrar o podcast do Data Hackers no SpotifyiTunesGoogle PodcastCastbox e muitas outras plataformas. Caso queira, você também pode ouvir o episódio aqui no post mesmo.  (em Português)

Já parou para pensar o quanto é complexo entender alguns termos utilizados por profissionais de dados no dia a dia?

"...o modelo apresenta heterocedasticidade...""...essa é uma distribuição leptocurtica..." "... isso foi devido ao viés de subcobertura..."

Se formos anotar num papel toda vez que vemos uma palavra desconhecida em uma apresentação feita por um estatístico, vamos precisar de um caderno inteiro. Pensando nisso a genial Cassie Kozyrkov (sério sigam o

é muito bom) decidiu criar um glossário com centenas de termos de difícil entendimento, explicando cada um deles de forma que uma pessoa "normal" possa entender.

Esse é um post pra salvar nos favoritos, fazer uma cola e guardar no bolso antes de assistir a próxima apresentação sobre estatística e dados.

(em Inglês)

 

Sinceramente não sei se existe uma tradução em português para o termo "Cheatsheets" mas tratam-se de documentos visuais para facilitar a consulta rápida a determinados padrões, fórmulas, atalhos etc e com isso deixar as pessoas mais produtivas. São materiais muito comuns em diferentes áreas de tecnologia (e comuns em outras áreas como provas e concursos).

Bom, os autores desse artigo fizeram uma verdadeira varredura pela internet em busca dos mais importantes cheatsheets que podem ajudar os profissionais de dados a serem mais produtivos e estão disponíveis para download e organizaram

.

É um material bem completo que passa por toda a área de dados, tem Cheatsheets de:

  • SQL

  • Web Scraping

  • Estatística/Matemática/Probabilidade

  • Ferramentas de BI

  • NLP

  • Modelagem de dados

  • Machine Learning, Deep Learning etc.

(em Inglês)

Um grupo de estudantes e professores da USP se juntou para aplicar técnicas de aprendizado de máquina e NLP, com o objetivo de criar um modelo que pudesse  predizer a probabilidade de um determinado texto ser uma "Fake News". (em português)

Obs: Estou aguardando ansiosamente até que um dia esse algoritmo esteja integrado ao grupo de Whatsapp das minhas tias.

"Quantization" é uma técnica utilizada para fazer seu modelo rodar mais rápido, com menor consumo de memória sem a necessidade de alterar a arquitetura do modelo. Nesse post o autor mostra o passo a passo de como utilizar essa técnica com o PyTorch.  (em Inglês)

Se você está em busca de evoluir seus conhecimentos em modelos de forecasting e análise de séries temporais não deixe de ler esse post. Trata-se de um guia completo em modelos ARIMA, mostrando todos os passos de implementação dos modelos em Python. (em Inglês)

Esse post mostra o passo a passo de como acessar API's com o R pegando como exemplo a integração com a API do Github. (Em Português)

VAGAS DA SEMANA

  • Conhecimentos profundos em análises estatísticas e em gerar insights para a organização;

  • Sólida experiência em liderança de pessoas;

  • Experiência em metodologias de pesquisa;

  • Inglês ou espanhol avançado;

  • Conhecimento em Banco de Dados Relacionais (SQL);

  • Desenvoltura para trabalhar com planilhas (Excel/Google Sheets);

  • Experiência em qualquer ferramenta de visualização de dados (ex. PowerBI, Metabase);

  • Experiência em análise exploratória de dados;

  • Conhecimento em linguagens de programação (R/Python);

Entenda de uma vez por todas as diferenças entre profissionais de dados júnior x pleno x sêniorEsse vídeo é do final de 2021, mas continua muito atual. E entendo que seja extremamente necessário voltarmos a ele num momento que influenciadores (que não dominam tecnologia) estão por aí discutindo sobre o tema e muitas vezes influenciando pessoas novas na área sobre conceitos totalmente errados.Bom nesse vídeo, O Paulo co-founder do Data Hackers que tem muitos anos de experiência com dados e tecnologia esclarece os principais pontos que diferem um profissional júnior, pleno e sênior, dando dica valiosas para quem está em busca de evoluir na carreira. (em Português)

Let's Data Podcast: Entrevista com o Gabriel Moreira sobre o mundo dos sistemas de recomendação O Let's Data Podcast traz pessoas interessantes para conversar sobre ciência de dados e inteligência articificial, e contar histórias peculiares e fascinantes sobre a vida. Dessa vez eles entrevistaram o Gabriel Moreira que atua como senior applied research scientist na NVIDIA e o assunto foi Sistemas de Recomendação. Conteúdo imperdível. (em Português)

Postei aqui e saí correndo...🏃 🏃‍♂️ 

Você já ouviu falar no índice Big Mac (Big Mac Index)? É um índice calculado sobre o preço do Big Mac, comparando esse preço em mais de 100 países de tempos em tempos para tentar entender como se difere o poder de compra da população nos diferentes países do mundo. O Dataviz da semana mostra em forma de animação como esse índice mudou de 2004 a 2022 em vários países, explicando um pouco do impacto da inflação no poder de compra de diferentes populações do mundo.  (em Inglês)

NVIDIA GTC 2022: #1 AI Conference21 a 24 de Março - Evento Gratuito e 100% Online7º Fórum Big Data em Oncologia07 de Abril - Evento Gratuito e 100% OnlineData + AI Summit27 a 30 de Junho - Evento Gratuito e 100% Online

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso

.