Data Hackers Newsletter
Posts
Você deveria continuar aprendendo programação?

Você deveria continuar aprendendo programação?

E mais: O que significa (de verdade) Intervalo de Confiança?; Como aprender Matemática usando Programação.

Paulo Vasconcellos
April 29, 2024 • Tempo de leitura estimado: 12 minutos

Fala, Data Hackers!

Nessa semana em que entramos em Maio, bora começar nos atualizando sobre as novidades do mundo dos dados? Nessa edição, trazemos um podcast especial em que discutimos até que ponto vale a pena aprender programação nos dias de hoje, além de um artigo que traz detalhes para compreender melhor a chamada “Maldição da Dimensionalidade”. Fora isso, trazemos ainda um post para entender melhor os Intervalos de Confiança, um dos conceitos mais básicos e mal interpretados da estatística, e um site que permite aprender conceitos matemáticos usando programação.

Confira outros destaques dessa edição:

Você deveria continuar aprendendo programação? - Data Hackers Podcast

Nos últimos meses, a discussão sobre a substituição de desenvolvedores foi reacendida por episódios como a fala do CEO da Nvidia, Jensen Huang, que foi interpretada por alguns veículos como um recado claro: "Parem de ensinar crianças a programar". Além disso, tivemos ainda o surgimento do DevIn, uma IA desenvolvedora de código.

Mas até que ponto tudo isso se aplica? Será que você deveria parar de programar, já que as máquinas poderão fazer isso no futuro? Para discutir sobre esse assunto, trazemos esse episódio especial do Data Hackers (com vídeo!), gravado diretamente do TDC AI Summit, que aconteceu em São Paulo no último mês. Para esse papo sobre o futuro do aprendizado, nós convidamos Andrea Longarini, Cloud Solutions Architect de Dados e IA na Microsoft, e Danilo Vitoriano, embaixador na Woovi.

Assita agora mesmo, e entenda melhor no que vale a pena ou não investir tempo e esforço!

A matemática por trás da Maldição da Dimensionalidade

Maldição da Dimensionalidade é algo que sempre fez parte do aprendizado de pessoas que trabalham com Machine Learning. Mas, você por acaso já entrou nos detalhes matemáticos sobre essa "maldição"? Este artigo mergulha no conceito do que de fato é a Maldição da Dimensionalidade e ajuda a entender a matemática por trás deste surpreendente fenômeno que surge quando se trabalha em dimensões mais elevadas. (em Inglês)

O que significa (de verdade) Intervalo de Confiança?

Intervalo de confiança é uma das primeiras coisas que aprendemos em Estatísca, mas mesmo sendo um conceito tão básico, muitas vezes é alvo de má interpretação. Um exemplo: você sabia que um intervalo de confiança de 90% não significa necessariamente que em 90% das vezes o resultado estará dentro dele?

Este post do "Probably Overthinking It" traz essa e outras questões, além de dar detalhes sobre as diferentes visões frequentistas e bayesianas a respeito dos IC. (em Inglês)

Como aprender Matemática usando Programação

O Math to Code é um site muito interessante que torna possível aprender conceitos matemáticos através de uma das coisas que os profissionais de tecnologia mais estão acostumados a fazer: programar.

O site contém uma série de exercícios que permitem implementar algumas fórmulas e equações utilizando NumPy, o que permite assimilar os conceitos de forma didática e intuitiva. (em Inglês)

OUTROS TÓPICOS

IBM adquire Hashicorp
O mercado da tecnologia é dinâmico e não cansa de nos surpreender: essa semana, a IBM pegou toda a indústria de surpresa ao adquirir a Hashicorp, criadora da ferramenta de infraestrutura “as code” Terraform. A ideia é acelerar a automação multi-nuvem e levar os produtos da IBM para um público mais amplo. (em Inglês)

Uma análise do R1 Rabbit, a "IA do Coelho"
Durante o CES 2024, uma empresa que chamou bastante a atenção foi a Rabbit, cujo principal produto, o Rabbit R1, é um dispositivo pequeno, similar a um broche, que serve como um assistente para as pessoas em diversas tarefas. Será que depois do fiasco que foi o Humane AI Pin, esse dispositivo terá o mesmo destino? Confira essa análise do The Verge. (em Inglês)

Óculos da Ray-Ban e Meta agora têm IA multimodal
Quando a Ray-Ban e a Meta se juntaram para lançar seus “óculos inteligentes” no ano passado, a novidade se mostrou uma ótima forma de capturar conteúdo e um headphone robusto, mas ainda faltava a cereja do bolo: a interação com uma IA multimodal. Finalmente, a IA foi disponibilizada nos óculos, justamente em um momento em que vários equipamentos envolvendo IA (como o Humane AI Pin) se mostraram decepcionantes. Confira tudo nesta matéria. (em Inglês)

As (possíveis) origens do ponto-e-vírgula na programação
Você já se perguntou por que tantas linguagens de programação usam ponto-e-vírgula para indicar o fim de uma sentença? Quando estava desenvolvendo sua própria linguagem, a programadora Nicole Tietz ficou se perguntando a respeito e resolveu pesquisar. Neste post, ela divide o que descobriu. (em Inglês)

Estamos testemunhando o fim da Internet?
Com o surgimento de ferramentas de IA que potencializaram muito a criação de conteúdo na Internet, uma teoria voltou a ser amplamente discutida: a Teoria da Internet Morta. Apesar de seu aspecto conspiracionista, essa teoria propõe que a maioria esmagadora dos conteúdos disponíveis atualmente na Internet não foi produzida por humanos, mas sim por bots e outros recursos artificiais. É fato que a IA generativa ampliou a criação de conteúdos artificiais, mas a pergunta é: até que ponto isso é ruim? Este artigo ajuda a entender um pouco mais sobre o assunto. (em Inglês)

DICA DE CURSO

Fundamentos de quantization com HuggingFace

LLMs podem ocupar muitos gigabytes, o que limita o que pode ser executado no hardware do consumidor. Mas a quantização pode comprimir drasticamente o espaço exigido, aumentando a gama de modelos disponível para os desenvolvedores. É possível reduzir o tamanho de um modelo em 4x ou mais, e ainda manter bom desempenho. Este minicurso ensina a quantizar praticamente qualquer modelo de código aberto, habilidade que tende a ser cada vez mais útil, já que o tamanho dos modelos só tem aumentado. (em inglês)

VAGAS DA SEMANA

Cientista de Dados Júnior - Mercado Livre

Osasco-SP - Híbrido

Contar com conhecimentos básicos-intermediários sobre Python e SQL;
Conhecer as ferramentas e métodos de elaboração de modelos de previsão, incluindo Facebook Prophet, árvores de decisão, regressão linear, e algoritmos para comportamentos não lineares como rede neurais, entre outras;
Possuir conhecimento com modelos preditivos, abrangendo a propensão de vendas, as recomendações e as associações;
Ter conhecimentos sobre modelos de otimização.

Coordenação de Engenharia de Plataformas - Itaú Unibanco

São Paulo-SP - Presencial

Experiência em Python;
Experiência em CI/CD com Github Actions;
Conhecimentos em nuvem, preferencialmente AWS;
Conhecimento de Design Patterns, SOLID e demais boas práticas para o desenvolvimento de software;
Conhecimento sobre protocolos de comunicação REST e gRPC;
Experiência na construção de soluções de automação (RPA);
Experiência com liderança de times técnicos em Desenvolvimento de Software.

MEME DA SEMANA

Agora você nunca mais vai esquecer os diferentes status HTTP…

DATA VISUALIZATION DA SEMANA

As patentes de IA, por país

Em se tratando de tecnologia, a IA se tornou a bola da vez nos últimos tempos, principalmente depois do boom dos modelos de IA generativa. Mas falando sobre pesquisas e registros de patentes envolvendo IA, você saberia descrever o cenário? Neste Dataviz, o pessoal do Visual Capitalist mostra o número de patentes que cada país registrou de 2012 a 2022. Spoiler: a China ultrapassou os EUA em 2013 e teve um crescimento absurdo nos últimos anos, a ponto de, em 2022, ter registrado mais patentes de IA que todos os outros países somados. (em Inglês)