60 Prompts de ChatGPT para Data Science (testados, validados e organizados) 🤓

60 prompts de ChatGPT para Data Science

(testados, validados e organizados!)

Fala Data Hackers, bora para mais uma semana começando com a sua newsletter preferida?

Hoje o assunto principal é mais que um post… Trata-se de um verdadeiro canivete suíço para quem busca mais produtividade no dia a dia de dados. Encontramos uma curadoria de prompts de ChatGPT com o foco no dia a dia dos profissionais de dados. Esse é o tipo de conteúdo que pode te ajudar a reduzir drasticamente o volume de tarefas repetitivas que você faz no dia a dia.

Mas não para por aí, vamos mostrar tudo que rolou na semana passada, marcada por grandes eventos globais de AI, pois simultaneamente rolaram o Data + AI Summit promovido pela Data Bricks e o Snowflake Summit, os eventos trouxeram muitas novidades para a área de dados como o lançamento de novas tecnologias e uma prévia do que está por vir para os próximos meses. Ainda foram divulgadas diversas novas parcerias e aquisição de empresas (o mercado de dados está pegando fogo!).

Além disso temos muitos outros assuntos interessantes:

Quem avisa amigo é! Essa terça (04/07 as 20h) teremos uma live sensacional no canal de Youtube do Data Hackers. Convidamos Luiz Simões o Data Hacker que ganhou o Challenge do ano passado e levou um PlayStation 5 para casa. Na Live o Luiz vai contar:

  • Como entrou para área de dados do zero aprendendo online

  • Dicas de visualizações de dados que chamam a atenção das pessoas

  • Como organizar um Jupyter Notebook de forma profissional

  • Dicas para cruzar dados e extrair insights valiosos para o negócio

A live vale tanto para quem está começando quanto para quem já é experiente na área mas deseja que seus projetos tenham mais destaque e chamem atenção das pessoas.

Acesse o link aqui (em Português)

É isso mesmo que você leu. Sem pegadinhas, sem enrolação, 60 prompts direto ao ponto!

Travis Tang atua na área de DS e teve a seguinte ideia: Será que o ChatGPT pode ajudar um cientista de dados a ser mais produtivo?

Desde então ele pegou cada aspecto da rotina de um profissional de dados e tentou encontrar prompts que pudessem ajudar na automação de tarefas, incluindo prompts com o o foco em:

  • Treinamento de modelos

  • Explorar dados

  • Escrever Regex

  • Gerar dados sintéticos

  • Interpretar modelos

  • Explicar códigos

  • Otimizar códigos

  • Simplificar códigos

  • Documentar projetos

  • Escrever SQL

  • Formatar tabelas e arquivos

Esses são só alguns dos exemplos de como o ChatGPT pode ser útil para profissionais da área de dados, no artigo você encontra 60 prompts organizados acompanhando as principais rotinas de um cientista de dados no dia a dia para ajudar todos da área a ter mais eficiência no trabalho. (em Inglês)

Na última semana ocorreram dois dos maiores eventos de dados do ano, e ambos rolaram ao mesmo tempo, organizados pelas plataformas de dados Snowflake e Databricks (que também possuem soluções concorrentes).

O time da Monte Carlo foi rápido, patrocinou ambos eventos, e preparou em primeira mão um resumo com os highlights dos eventos, mostrando as novas tecnologias lançadas, novas divulgações, principais palestras e tudo de interessante que cada um dos eventos apresentou para o público.

Para você que não pôde participar dos eventos, pelo menos agora pode acompanhar esse resumo e depois procurar pelos conteúdos que mais te interessarem no Youtube, pois algumas palestras já foram disponibilizadas para o público gratuitamente. (em Inglês)

Desde o boom do lançamento do ChatGPT, as tecnologias com o foco em AI Generativa e LLM's tomaram a atenção do mundo dos negócios e as discussões sobre o futuro das empresas mas certamente não vai parar por aí.

Nesse primeiro semestre de 2023 já temos visto inclusive algumas mudanças radicais na atuação de profissionais de dados, áreas da ciência como NLP, Visão Computacional foram as primeiras que tiveram impacto direto, mas muitas outras estão começando a mudar conforme vão surgindo novidades.

Até mesmo a engenharia de dados deve passar por mudanças radicais com a busca de dados através de linguagem natural e geração de ETLs através de AI Generativa.

Diante de tantas mudanças nós profissionais precisamos nos atualizar para acompanhar as novidades e uma excelente prática é atualizar nosso portfólio a medida que vamos ganhando novos conhecimentos. Pensando nisso separamos esse conteúdo com 10 ideias que projetos de LLM que podem incrementar seu portfólio! (em Inglês)

OUTROS TÓPICOS

A Databricks, uma das maiores e mais relevantes plataformas de dados, formalizou um acordo definitivo para adquirir o MosaicML, uma renomada plataforma GenAI. A intenção por trás da aquisição, avaliada em aproximadamente US$ 1,3 bilhão, incluindo pacotes de retenção, é democratizar o acesso à IA generativa para organizações em todo o mundo e integrar cada vez mais esse tipo de tecnologia a sua plataforma. (em Inglês)

A Snowflake, outra gigante dos Dados, e a Nvidia anunciaram na última semana que estão formando uma parceria para oferecer a empresas de todos os portes um caminho acelerado para criar aplicações de IA generativa personalizadas, usando dados proprietários dentro da Snowflake Data Cloud. Com a plataforma Nvidia NeMo para o desenvolvimento de grandes modelos de linguagem (LLMs) e a computação acelerada por GPU da Nvidia, a Snowflake permitirá que as empresas usem os Dados em suas contas da Snowflake para criar LLMs personalizados para serviços avançados de IA generativa. (em Inglês)

Esse maluco teve uma ideia genial. Utilizou uma famosa plataforma para "freelas" na área de Tecnologia e Dados para pagar por sessões de mentorias com 10 referências na área de dados. Ele pegou tudo que aprendeu nas mentorias e resumiu nesse artigo, com dicas de onde começar, como se especializar, passo a passo para encontrar clientes, como aumentar o valor do serviço prestado e até mesmo como viver 100% de projetos freelance. Excelente conteúdo para quem busca mais liberdade de atuação na área de dados. (em Inglês)

O cofundador e CEO da Google Deepmind, divisão de inteligência artificial da empresa, disse em uma entrevista que eles estão desenvolvendo um sistema para bater de frente com o ChatGPT ou até superá-lo. De acordo com Demis Hassabis, o Gemini combinará a tecnologia do LLM com as técnicas usadas no AlphaGo, programa de IA da DeepMind baseado na técnica de aprendizado por reforço, em que o software é apresentado para problemas complexos e a IA recebe feedbacks sobre suas falhas para melhorar seu desempenho. (em Português)Conheça a Solara: A lib que pode substituir o Streamlit na construção de webapps em PythonSolara é uma biblioteca que foi lançada recentemente com o objetivo de ajudar profissionais de dados a criar aplicativos da Web em Python puro. Em sua documentação, ela oferece alguns recursos interessantes, como componentes reutilizáveis ​​e uma integração simples com Jupyter Notebooks. Um detalhe que chamou atenção é que o próprio site oficial do Solara também é construído com o Solara, o que não acontece no Streamlit 😆 . (em Inglês)

"Drifts” em modelos de Machine Learning em produção são bem mais frequente que a maioria das pessoas imaginam, e costumam tirar a paz de quem atua na área de ML Engineering. Nesse artigo são apresentados 5 métodos para detectar de forma imediata esse tipo de comportamento nos modelos e assim poder atuar para reduzir os problemas consequentes. (em Inglês)

DICA DE VÍDEO

Data + AI Summit: Novidades no Apache SparkUm dos pontos altos do evento Data + AI Summit que rolou em San Francisco na última semana foram as novidades que acabam de ser lançadas em relações a diferentes tecnologias, como Delta Lake e Spark. Nesse vídeo você acompanha em primeira mão tudo de novo que foi lançado no Spark. (em Inglês)

VAGAS DA SEMANA

  • Excelência em Python e boas práticas de desenvolvimento (ex: ferramentas de versionamento);

  • Sólida experiência prática e teórica em Machine Learning supervisionados e não supervisionados (RandomForest, XGBM, Neural Nets, controle de overfit, validação de modelos, feature selection e engineering, etc);

  • Paixão por resolver problemas e construir soluções baseadas em dados, avaliando seu impacto em termos do retorno para o negócio;

Belo Horizonte - MG

  • Conhecimento intermediário em Machine Learning;

  • Python (scikit-learn, tensorflow, pytorch);

  • SQL e NoSQL;

  • Conhecimentos em Cloud AWS;

  • Conhecimento em implantação com Docker, containers, desenvolvimento e consumo de dados API;

MEME DA SEMANA

Dica do @datascience_memes

DATA VISUALIZATION DA SEMANA

Nessa análise super interessante a equipe do The Pudding resolveu investigar a fundo a história das pessoas que aparecem em mais de 200 moedas de diferentes países. Com toda essa informação em mãos criaram visualizações de dados incríveis mostrando quais as características mais comuns das pessoas estampadas em notas e moedas ao redor do mundo. (em Inglês)

PROXIMOS EVENTOS E MEETUPS

Semana de Finanças Quantitativas - Prof. Thiago Marques10 a 14 de julho - 100% Online e Gratuito

Acelerando Dashboards com Design System 12 de julho, 18h - 100% Online e Gratuito

Causal Inference symposium12 de Setembro - 100% Online

Big Data Brazil Experience 2023 21 de outubro - SP - Participantes do Data Hackers tem descontos pelo link

Obs: gostaria de ter seu evento divulgado aqui? Basta compartilhar ele em nosso canal do slack.

Logo

Copyright © datahackers.com.br.Gostaria de parar de receber esses emails?Você pode atualizar suas preferências ou remover o cadastro dessa lista de emails.

Twitter icon
Website icon
LinkedIn icon
Medium icon