O Fim da Economia dos Teoremas

David Bessis, 25 de Abril de 2026
Link para o artigo original: [David Bessis (Substack)]
112 minutos
"O produto da matemática é a clareza e a compreensão. Não os teoremas em si mesmos."
—Bill Thurston
Diagrama manuscrito por Alexander Grothendieck
O meu melhor teorema é aquele que nunca cheguei a escrever.
Cristalizou-se numa manhã radiosa em Lausanne, na Suíça, enquanto eu preparava a minha última palestra como convidado. A demonstração parecia tão óbvia — e o resultado tão convincente — que tomei a decisão imprudente de editar os meus diapositivos à última da hora. O tempo estava a esgotar-se e só consegui incluir o anúncio como uma observação informal no final do último diapositivo, em vez de o enunciar como um teorema a sério.1
Já tinha saído da academia e fundado uma startup de machine learning. Sabia que estaria demasiado ocupado para escrever uma demonstração limpa e publicá-la. Essa foi a minha desculpa para ser descuidado. Escrevi a observação e abandonei a apresentação como uma mensagem numa garrafa.
A minha esperança era que algum jovem matemático brilhante a recuperasse um dia e formalizasse o resultado como parte de uma teoria mais ampla. Se tivesse sorte com a aleatoriedade intrínseca da atribuição, pensei, talvez fosse lembrado como o teorema da decomposição celular de Bessis.
Mas isso foi estupidez. Ao reclamar o resultado, eliminei o incentivo para que alguém o escrevesse.
Se tivesse de escolher o meu segundo melhor resultado, seria o Teorema 0.5 do meu antigo preprint sobre categorias de Garside. Tinha grandes ambições para este artigo, mas acabei por não o submeter em lado nenhum. O processo criativo esgotou-me e abandonei a investigação ativa antes de recuperar a coragem para limpar as secções preliminares.
Para um segundo melhor, este teorema é surpreendentemente fácil de demonstrar. Depois de acertar nos preliminares, são apenas algumas páginas de teoria de grupos bastante terrestre.
Quanto aos preliminares, são ainda mais fáceis. Basta plagiar uma dúzia de artigos clássicos numa subárea arcana chamada teoria de Garside, substituindo o conjunto original de axiomas por um ligeiramente mais geral. Se percebermos o que é suposto fazer, é quase impossível encontrar dificuldades sérias — é apenas uma gigantesca operação conceptual de localizar e substituir. Mas temos de acreditar na minha palavra, porque eu recuei perante a perspetiva de produzir as centenas de páginas de detalhes necessários.
Se pensa que a parte difícil do trabalho de um matemático é demonstrar teoremas, considere este contraexemplo — desde o momento em que concebi o Teorema 0.5, soube que era verdadeiro e que demonstrá-lo seria simples.
Qual foi, então, a parte difícil?
Conjeturar o enunciado exato e escrevê-lo?
Nem por isso. Neste exemplo, essa parte foi igualmente simples.
A parte difícil foi intuir que deveria existir "algo como o Teorema 0.5" e criar um enquadramento conceptual onde fosse fácil de expressar. Depois de acertar nas definições, o resto fluiu mais ou menos organicamente.
A matemática de investigação nem sempre é assim, mas há dias milagrosos em que basta calçar os esquis e, quando damos conta, estamos a acelerar ladeira abaixo.
Jean-Pierre Serre disse, famosamente, que escrever o seu artigo revolucionário sobre feixes coerentes não exigiu qualquer pensamento. Tudo se encaixou tão naturalmente que a sua máquina de escrever gerou as 100 páginas inteiramente por si só, como se o artigo já pré-existisse.
Mas eu não era o Jean-Pierre Serre e ele não me emprestaria a sua máquina de escrever. É por isso que a minha ideia matemática mais brilhante nunca chegou a ser publicada.
Sinto-me triste com isso? Na verdade, não. O meu preprint continua disponível gratuitamente no arXiv e já foi citado dezenas de vezes, inclusive por artigos conceituados. A verdadeira inovação não foi o Teorema 0.5, mas a linguagem que o tornou possível, especialmente as Definições 2.4 e 9.3 — e essa linguagem encontrou o seu caminho até um livro de 700 páginas sobre teoria de Garside que preencheu grande parte dos preliminares em falta.
Para ser honesto, também tive uma razão egoísta para sacrificar o meu preprint mais inovador. Isso permitiu-me concentrar no preprint mais tedioso onde usei a Definição 9.3 como ingrediente mágico na resolução de um problema clássico no meu domínio, a conjetura 𝐾(𝜋,1) para grupos de reflexão complexos finitos, o que elevou permanentemente o meu estatuto simbólico como matemático.
Mas, na verdade, o David que resolveu a conjetura 𝐾(𝜋,1) é um parasita social do matemático muito melhor, o David que criou as Definições 2.4 e 9.3.
O código de honra em crise
Nos últimos meses, ao confrontar-me com a situação rapidamente cambiante em torno da IA e da matemática, descobri-me mais perturbado do que jamais esperara.
Em teoria, deveria sentir-me vindicado e feliz. Na prática, estou também perplexo, preocupado e triste.
A parte feliz de mim vê uma revolução genuína e entusiasma-se. A parte vindicada tem reivindicações legítimas de se ter preparado para ela científica e epistemologicamente. A parte perplexa está atordoada com o cronograma e a frenesim que o acompanha. A parte triste sente nostalgia por um estilo de vida e um sistema de valores com os quais se envolveu e dos quais se afastou, e que poderão em breve desaparecer.
A parte preocupada detém a síntese. Sempre soube que o público em geral tinha uma perceção errada da matemática, mas nunca esperei que isto se tornasse uma ameaça existencial para a própria disciplina.
No meu livro Mathematica: a Secret World of Intuition and Curiosity, enquadrei o mal-entendido como a tensão entre duas versões da matemática: a matemática oficial e a matemática secreta.
A matemática oficial manifesta-se como um sistema de dedução formal onde se parte de axiomas e se derivam mecanicamente teoremas. É o paraíso dos nerds, um mundo onde a verdade assume valores binários, o raciocínio é válido ou inválido, e tecnicamente não há espaço para tretas.
A matemática secreta é a parte humana da história — porque é que a matemática oficial foi inventada, como podemos interagir com ela com sucesso, os seus efeitos nos nossos cérebros e as técnicas mentais bizarras através das quais os matemáticos expandem continuamente o seu território.
A matemática secreta nunca chegou ao currículo, porque lhe faltam as qualidades definidoras da matemática oficial e também porque parece periférica. A matemática oficial é fria, dura, lógica, objetiva e consta que é a linguagem do universo. A matemática secreta é suave, difusa, subjetiva e, em contraste, parece uma barata história pedagógica de fundo.
Não admira que os matemáticos profissionais tenham uma visão tão dissociativa do seu trabalho.
A primeira regra do Clube da Intuição é: não se fala do Clube da Intuição. A segunda regra é: se realmente quiser falar sobre intuição, faça com que pareça casual e acessório, porque não somos o departamento de psicologia. A terceira regra é que as definições valem zero pontos, o trabalho expositivo conta negativamente, e os melhores empregos devem ir sempre para as pessoas que demonstraram os teoremas mais difíceis.
Se acha que estou a exagerar, eis o que G. H. Hardy escreveu na sua célebre (e insuportável) autobiografia matemática:
Não há desprezo mais profundo, ou no geral mais justificável, do que o daqueles que fazem por aqueles que explicam. Exposição, crítica, apreciação, é trabalho para mentes de segunda categoria.
Isto é o auge da dissociação. À porta fechada, os matemáticos queixam-se rapidamente da maldição de Hardy. Insistem na importância do ensino, até para a sua própria compreensão da matéria. Lamentam a obsessão patológica do sistema com a prioridade da demonstração de teoremas, enquanto todos sabem que o trabalho difícil ocorre frequentemente fora desse circuito, ao tentar dar sentido a resultados existentes. No entanto, em público, estão vinculados ao código de honra dos matemáticos. Demonstrem teoremas e calem-se!
Há uma exceção, no entanto. Depois de se ganhar a medalha Fields, pode-se dizer o que se quiser.
Bill Thurston, medalha Fields de 1982, foi um dissentidor espetacular. Dois anos antes da sua morte, participou numa troca extraordinária no MathOverflow, em resposta a esta questão colocada por um estudante inseguro:
O que pode alguém (como eu) contribuir para a matemática? Acho que a matemática é feita por pessoas como Gauss e Euler — embora seja possível aprender o seu trabalho e compreendê-lo, nada de novo é criado ao fazer isto. Podemos reescrever os seus livros em linguagem e notação modernas ou guiar outros a aprendê-los também, mas nunca acreditei que esta fosse a parte significativa do trabalho de um matemático; que seria a criação de matemática original. Parece inteiramente plausível que, com todas as pessoas tremendamente inteligentes a trabalhar tão arduamente em matemática, não reste nada para alguém como eu... Talvez o meu valor seja atuar como carne para canhão? Porque enviar homens suficientes acabará por romper alguma barreira.
Thurston respondeu:
Não é à matemática que precisas de contribuir. É mais profundo do que isso: como poderás contribuir para a humanidade, e ainda mais profundamente, para o bem-estar do mundo, ao praticar matemática? Uma questão destas não é possível responder de forma puramente intelectual, porque os efeitos das nossas ações vão muito além da nossa compreensão. Somos animais profundamente sociais e profundamente instintivos, tanto que o nosso bem-estar depende de muitas coisas que fazemos e que são difíceis de explicar de forma intelectual. É por isso que fazes bem em seguir o teu coração e a tua paixão. A razão nua e crua provavelmente te desencaminhará.2 Nenhum de nós é suficientemente inteligente e sábio para o descobrir intelectualmente. O produto da matemática é a clareza e a compreensão. Não os teoremas em si mesmos. Há, por exemplo, alguma razão real para que resultados tão famosos como o Último Teorema de Fermat, ou a conjetura de Poincaré, importem realmente? A sua verdadeira importância não está nos seus enunciados específicos, mas no seu papel em desafiar a nossa compreensão, apresentando desafios que levaram a desenvolvimentos matemáticos que aumentaram a nossa compreensão... A matemática só existe numa comunidade viva de matemáticos que espalha compreensão e dá vida a ideias, tanto antigas como novas. A verdadeira satisfação da matemática está em aprender com os outros e partilhar com os outros. Todos nós temos uma compreensão clara de poucas coisas e conceitos nebulosos de muitas mais. Não há forma de ficar sem ideias que precisam de clarificação...
Aqui precisamos de fazer uma breve pausa metafísica, porque é muito fácil descartar as palavras de Thurston como "boas sensações" ou "woke".
No meu primeiro artigo no Substack, declarei (meio a brincar) que estivemos errados acerca da matemática durante 2300 anos, presos num falso dilema entre o formalismo ("a matemática é um jogo sem sentido de símbolos formais") e o platonismo ("a matemática captura propriedades de entidades reais que vivem no mundo perfeito das ideias").
A minha resolução conceptualista proposta é uma reformulação da visão de Thurston: a matemática depende de facto de um jogo sem sentido de símbolos formais, mas só jogamos este jogo porque projetamos significado nele.
O significado é um fenómeno cognitivo — um produto da nossa arquitetura neural — e não um acesso direto à transcendência.
Quando "fazemos matemática", manipulamos expressões formais e desenvolvemos gradualmente uma intuição para aquilo que representam, como se fossem ponteiros para objetos que "existem" num sentido platónico. Os platónicos tomam este efeito secundário neuroplástico pelo seu valor facial. Os formalistas veem-no como acessório. Os conceptualistas como eu reconhecem a matemática como uma infraestrutura cognitiva crítica da espécie humana.
Uma pergunta natural é porque é que a resolução conceptualista demorou tanto tempo a emergir. Uma razão é que ela vai contra a visão espiritualista prevalecente, que recusa interpretações fisicalistas da matemática.
Também vai contra o código de honra dos matemáticos. A maldição de Hardy é tão poderosa que até Thurston achou difícil superá-la. Quando vários utilizadores do MathOverflow lhe agradeceram pela sua contribuição, ele observou em resposta:
Obrigado pelos comentários. Tento escrever o que parece real. A esta altura, não tenho motivo para temer como serei julgado, o que torna tudo muito mais fácil para mim. É gratificante quando a minha realidade significa algo para os outros.
Mas então, como é que um código de honra tão tóxico sobreviveu durante tanto tempo?
A resposta é simples. O código de honra era útil para a matemática enquanto disciplina académica. Ajudou-a a manter-se excecionalmente saudável e meritocrática, como notei no epílogo do meu livro:
Este sistema tem os seus méritos. Reduz a arbitrariedade e ajuda os matemáticos a protegerem-se contra a complacência e o nepotismo. Quando uma disciplina lida com verdades eternas, oferece uma forma elegante de avaliar carreiras.
O código de honra também serviu de guia aos próprios investigadores, ao avaliarem novas ideias e novas direções de investigação. A construção de conceitos e a resolução de problemas, as duas facetas da matemática, estão numa relação simbiótica, como observou Peter Scholze, medalha Fields de 2018:
O que mais me importa são as definições. Para começar, os humanos descrevem a matemática através da linguagem e, como sempre, precisamos de palavras precisas para articular as nossas ideias claramente... Infelizmente, é impossível encontrar as definições certas através do pensamento puro; é necessário detetar os problemas corretos onde o progresso exigirá o isolamento de um novo conceito chave.3
Foi assim que o sistema funcionou durante milénios. Os matemáticos criavam valor ao introduzir novos conceitos, mas a regra era que só os teoremas punham pão na mesa. O acordo funcionava porque os dois aspetos andavam quase sempre de mãos dadas. David, o parasita social que reivindicou o crédito pela conjetura 𝐾(𝜋,1), era a mesma pessoa que criara as Definições 2.4 e 9.3.
Resolver uma grande conjetura era uma prova criptográfica de que se tinha chegado a uma inovação conceptual genuína.
Estou a usar o pretérito porque isto já não é o caso. Há uma vulnerabilidade estrutural no código de honra dos matemáticos e a IA começou a explorá-la de forma sistemática.
O caminho do Go e do Xadrez
O gatilho para este artigo foi um discurso de Geoff Hinton, que me apanhou desprevenido:
Concordo com Demis Hassabis, o líder da DeepMind, que há muitos anos diz que a IA vai ser muito importante para o progresso científico... Há uma área em que isso é particularmente fácil, que é a matemática, porque a matemática é um sistema fechado... Acho que a IA se tornará muito melhor que as pessoas em matemática, talvez nos próximos 10 anos. E dentro da matemática, é muito parecido com coisas como o Go ou o Xadrez, que são sistemas fechados com regras...
Estava habituado a que o público em geral estivesse profundamente enganado sobre a natureza da matemática. Mas não estava preparado para um vencedor do prémio Turing e do Nobel a compará-la com o Go e o Xadrez.
Escrevi uma pequena resposta no X e tentei seguir em frente, mas continuou a perturbar-me.
Depois tudo fez sentido. Há cerca de um ano, fui abordado por um jovem amigo matemático que fizera o doutoramento no meu domínio. Ele estava a pensar lançar um negócio de "IA para matemática pura" e eu orientei-o durante algum tempo.
Como ele — e como Hinton e Hassabis — estava plenamente convencido de que a IA estava prestes a transformar a matemática e a ciência em geral. Mas não tinha a certeza sobre o modelo de negócio e o produto mínimo viável.
Os matemáticos podem parecer luditas, mas raramente o são. Amam o papel e a caneta, o quadro negro e o giz, mas aderiram à revolução tipográfica de Donald Knuth. Há um século, escolheram reconstruir toda a sua pilha de conhecimento num novo sistema operativo, a teoria dos conjuntos, que prometia ganhos massivos em fiabilidade e escalabilidade. Algumas décadas depois, reconheceram que não havia diferença real entre uma demonstração matemática e um cálculo, e começaram a construir os primeiros computadores. A deep learning, com o seu uso intensivo de álgebra linear e gradiente descendente estocástico, é filha da matemática.
Nos anos 70, quando Kenneth Appel e Wolfgang Haken construíram uma demonstração assistida por computador do teorema das quatro cores, isso abriu um debate intenso sobre a natureza epistémica de tais demonstrações e a sua admissibilidade em revistas com revisão por pares. Embora, para ser honesto, nunca tenha havido grande suspense — os bárbaros venceram, porque havia bárbaros de ambos os lados.
Os computadores sempre fizeram parte da minha vida matemática4 e a promessa da IA e da autoformalização sempre me pareceu irresistível. Foi isso que me entusiasmou quando o meu amigo me contactou a pedir conselhos.
Comecei a olhar para o espaço da "IA para a matemática" e não conseguia compreender o que se passava. Porque estavam estas startups a angariar tanto dinheiro? A matemática pura é um mercado tão pequeno. Os investimentos pareciam desproporcionados.
A minha estratégia preferida, a que eu teria seguido, era criar o Wolfram Research da era da IA. A ciência e a tecnologia habilitadas pela matemática são um mercado muito maior do que a matemática pura e, como Wolfram demonstrou, há espaço para simplificar e mercadorizar a experiência de interagir com objetos matemáticos. Os utilizadores adoram o produto e é pegajoso.
Mas o meu amigo insistiu que queria fazer algo especificamente sobre matemática pura.
Não sabia o que dizer, porque estava entalado. Os únicos produtos úteis em que conseguia pensar eram localizadores de literatura e assistentes de demonstração interativos — difíceis de empacotar, difíceis de precificar e ainda mais difíceis de vender. Conseguia ver uma estratégia de negócio a longo prazo, mas era uma que não tocaria nem com uma vara de medir — tornar-se a Elsevier da era da IA, a marca mais odiada na ciência, um monopólio extrativo de braço torto que reempacota os comuns matemáticos numa experiência obrigatória.
Havia uma terceira estratégia, no entanto. Mas era arriscada e, como a anterior, exigia um certo grau de cinismo. Chamar-lhe-ia o luxury acquihire: 1/ construir um produto inútil que seja suficientemente impressionante, 2/ dar a impressão de que se resolveu um grande problema científico, 3/ rezar por uma fusão ou aquisição rápida por uma gigante tecnológica ou um grande laboratório de IA.
Ainda assim, os números não batiam certo. As startups de "IA para a matemática" rumava-se que estavam a angariar centenas de milhões. Devia haver uma tese de investimento mais inteligente, que eu estava a falhar em compreender.5
Depois ouvi que a Google estava a liderar um esforço massivo para resolver a existência e suavidade das equações de Navier–Stokes. Pensei, OK, percebo, é um problema do Prémio do Milénio. Mas, espera, isso ainda não faz sentido — o prémio é de um milhão de dólares, amendoins. Como um grande matemático me observou, a Google provavelmente mobilizou mais poder cerebral neste único esforço do que toda a comunidade jamais dedicou ao problema.
Só começou a fazer sentido depois de ouvir o discurso de Hinton.
Se a matemática é realmente um sistema fechado — ou se é nisso que todas as partes interessadas à volta da mesa estão dispostas a acreditar — então o pitch de investimento torna-se trivial: "A DeepMind resolveu o Go e o Xadrez, vamos resolver a matemática!"
Numa altura em que os principais laboratórios de IA estão a apostar biliões de dólares em como os humanos se tornarão obsoletos em breve, a promessa de "resolver a matemática", a jóia da coroa, o orgulho da raça humana, é simplesmente irresistível.
Levar um paquímetro para um tiroteio
A 5 de fevereiro, uma equipa de onze matemáticos de alto perfil (incluindo Martin Hairer, medalha Fields de 2014) anunciou o projeto First Proof e publicou um primeiro lote de dez "questões matemáticas ao nível da investigação":
Este manuscrito representa os nossos esforços preliminares para desenvolver uma metodologia objetiva e realista para avaliar as capacidades dos sistemas de IA de resolverem autonomamente questões matemáticas ao nível da investigação. Depois de deixarmos estas ideias fermentar na comunidade, esperamos poder produzir um benchmark mais estruturado dentro de alguns meses. Um dos nossos objetivos principais é desenvolver uma compreensão sofisticada do papel que as ferramentas de IA poderão desempenhar no fluxo de trabalho dos matemáticos profissionais. Embora os sistemas de IA comerciais estejam indubitavelmente já a um nível onde são ferramentas úteis para matemáticos, ainda não está claro onde é que os sistemas de IA se situam na resolução autónoma de questões matemáticas ao nível da investigação, sem um especialista no circuito.
De uma perspetiva puramente científica, não há nada de que reclamar. São pessoas incrivelmente inteligentes, a envolver-se numa controvérsia do mundo real com uma atitude de mente aberta e uma abordagem criativa.
A equipa do First Proof estava a fazer tudo corretamente — e foi isso que me aterrorizou.
Mas antes de explicar, devo reiterar que tenho uma opinião muito elevada deste projeto. A equipa representa a comunidade matemática no seu melhor, pessoas movidas pela curiosidade e integridade, dispostas a experimentar fora da sua zona de conforto, e de facto tiveram ideias genuinamente boas.
Daniel Litt escreveu um ensaio excelente, Mathematics in the library of Babel, sobre o projeto First Proof e a sua própria avaliação em primeira mão da situação da IA para a matemática. A sua perspetiva é a de um radical não-ludita, um matemático puro que se envolveu com LLMs durante anos e está genuinamente impressionado com o progresso recente.
Ficou surpreendido por quantos dos problemas abertos do First Proof acabaram por ser resolvidos pelas equipas da Google, OpenAI e outras. Pela sua própria contagem:
Parece provável que entre 6 e 8 [dos 10] problemas foram resolvidos corretamente se combinarmos todas as tentativas.
Há ressalvas sérias, no entanto:
Os modelos (e os humanos a supervisioná-los) geraram uma quantidade enorme de lixo, incluindo algumas soluções incorretas que alegavam estar formalizadas em Lean. Mesmo os melhores modelos/scaffolds parecem não ser capazes de detetar de forma fiável quando estão a produzir disparates.
Mesmo quando os sistemas de IA para a matemática operam autonomamente, o que poucos do grupo atual realmente fazem, ainda exigem que os humanos intervenham a montante e a jusante, nem que seja para avaliar os resultados e filtrar o lixo. Isto não é anedótico. Os laboratórios de IA estão a investir tanta inteligência humana nestes projetos, muito mais do que qualquer matemático da vida real pode mobilizar, que a delimitação nunca é totalmente clara. A ilustração mais condenatória é esta:
Não estava claro para a OpenAI quais das suas soluções para o First Proof estavam corretas.
Por outras palavras: sem o esforço pro bono da boa e velha comunidade académica, talvez nunca tivessem sabido. (Litt foi ele próprio um contribuidor.)
Na verdade, isto também se aplica a demonstrações geradas por humanos. Mas há uma nuance fundamental. Na forma humana de fazer matemática, a demonstração de teoremas e a construção de conceitos andam de mãos dadas, o que força as demonstrações a serem inteligíveis (nem que seja para os seus autores).
É aqui que a metafísica volta a morder. Se a matemática fosse apenas um jogo formal de símbolos sem significado, a inteligibilidade seria uma noção vazia. A realidade da prática matemática aponta energicamente na direção oposta. Acontece que a investigação publicada está cheia de erros, mas estes erros tendem a ser contidos e corrigíveis, precisamente porque as demonstrações geradas por humanos são significativas e (quase sempre) direcionalmente corretas — duas noções que são impossíveis de reconciliar com a visão formalista do mundo.
Isto não é uma nuance cosmética. É uma condição obrigatória para que a matemática exista como um empreendimento sustentável.
Como observou Litt, a característica essencial de ser "orientado para a verdade" estava ausente das soluções de IA para as questões do First Proof:
Muitas soluções corretas estão muito mal escritas, e a sua correção é extremamente difícil de verificar por causa disso... Nas soluções [humanas], as ideias principais, os obstáculos a superar, etc., são geralmente identificáveis; nas soluções [de IA] são frequentemente completamente obscuras. E no processo de escrever as suas soluções, os autores humanos desenvolvem frequentemente novos objetos úteis, terminologia, etc., para capturar o que estão a fazer, enquanto os modelos geralmente seguem em frente sem parar.
É aqui que entra a segunda perna da revolução da IA para a matemática: a autoformalização, a capacidade de transformar o estilo moderadamente informal das demonstrações produzidas por humanos — e os resultados dos LLMs treinados nelas — em derivações lógicas à prova de bala, verificáveis por máquina, expressas em linguagens especializadas como o Lean.
Em teoria, isto pode resolver a questão da correção e eliminar a necessidade de validação humana. Mas, como observou Litt, "houve apenas uma solução formalizada credível para qualquer problema, orquestrada de forma impressionante e manual por Tom de Groot."
Isto é, claro, uma situação em evolução. As apostas são altas e o investimento massivo. LLMs, scaffolding e autoformalização estão todos a fazer progressos constantes.
O que aconteceria se, daqui a um ano, a equipa do First Proof lançasse outro conjunto de 10 problemas de dificuldade equivalente? Litt não responde a esta pergunta específica, mas espera que a IA produza autonomamente resultados "a um nível comparável ao dos melhores artigos" dentro dos próximos anos.
Partilho do seu sentimento. Na minha opinião, o resultado provável seria que os principais laboratórios de IA obteriam um 10 perfeito, apresentando soluções totalmente automatizadas e totalmente corretas para todos os problemas.
Isso significa que a IA terá "resolvido a matemática" no início de 2027?
Claro que não. Há três ressalvas adicionais que tenho a certeza de que todos os insiders já terão identificado, mas que os leitores não especialistas podem ter perdido.
Ressalva n.º 1: Oceanos
A primeira é simples — as "questões ao nível da investigação" do First Proof não eram nem profundas nem difíceis. Estavam mais próximas de lemas técnicos, subproblemas intermédios bem calibrados que ocorrem no decorrer da demonstração de um teorema e são tipicamente tratados em alguns parágrafos ou páginas. Há um oceano entre um lema técnico e um artigo sério, outro oceano entre um artigo sério e um avanço, outro oceano entre um avanço e uma contribuição ao nível da medalha Fields, e ainda vários oceanos acima disso.
O First Proof está agora a trabalhar num segundo lote, que provavelmente incluirá problemas mais difíceis.
De uma perspetiva técnica, eles escolheram o nível certo para o seu primeiro lote. Isto só apareceu em retrospetiva: a pontuação final ficou acima de 0/10 e abaixo de 10/10, no ponto ideal para o seu objetivo declarado de encontrar uma "metodologia objetiva e realista para avaliar as capacidades dos [atuais] sistemas de IA".
No entanto, penso que lançar um benchmark que não incluía problemas sérios foi extremamente perigoso. O público em geral não lê as letras miúdas e pode nem saber o que é um lema. Se a Google ou a OpenAI tivessem obtido um 10 perfeito, o título teria sido: "FIM DE JOGO: Os melhores matemáticos do mundo desafiaram uma IA com 10 problemas ao nível da investigação; a IA destruiu todos e cada um deles."
Ressalva n.º 2: A saliência
O que torna um grande problema de matemática diferente de um lema técnico? A resposta não está na dificuldade computacional, mas na saliência conceptual — a dimensão do espaço conceptual que precisa de ser mapeado antes que o problema possa sequer ser formulado.
Num avanço matemático típico, há um período mais ou menos longo de confusão, onde se tem uma noção de que "deve haver algo ali", mas ninguém consegue articular exatamente o quê. As pessoas certas passam por várias fases de iluminação parcial e deceção, até que eventualmente uma formulação estável emerge.
Este processo — que é o coração do empreendimento matemático — pode demorar anos, décadas ou séculos.
A conjetura de Poincaré foi formulada em 1904 e resolvida por Grigori Perelman em 2003. O Último Teorema de Fermat foi conjeturado em 1637 e resolvido por Andrew Wiles em 1994. A hipótese de Riemann permanece em aberto desde 1859.
O que torna estes problemas tão difíceis não é a demonstração em si — é a formulação do problema, a construção do enquadramento conceptual onde uma demonstração se torna possível.
A IA pode ser muito boa a resolver problemas bem definidos. Mas não é boa — pelo menos, não ainda — a formular os problemas certos. E é aí que reside o verdadeiro valor da matemática.
Ressalva n.º 3: O fantasma na máquina
Há uma dimensão da matemática que é frequentemente ignorada nas discussões sobre IA: o papel da intuição e da compreensão humanas.
Quando um matemático "compreende" um teorema, não se trata apenas de saber que é verdadeiro e de ser capaz de reproduzir a demonstração. Trata-se de ter uma perceção intuitiva do porquê de ser verdadeiro, de como se enquadra no panorama mais amplo e de quais as suas implicações.
Esta compreensão intuitiva é o que permite aos matemáticos fazer progressos reais. É o que lhes permite ver conexões entre domínios aparentemente não relacionados, formular novas conjeturas e desenvolver novas teorias.
A IA, tal como existe atualmente, não tem esta capacidade. Pode gerar demonstrações formais, mas não as "compreende" no sentido humano. Não tem intuição. Não tem a capacidade de ver o quadro geral.
Isto não é apenas uma limitação técnica — é uma limitação fundamental. E é por isso que a IA, por muito poderosa que se torne, nunca substituirá verdadeiramente os matemáticos humanos.
Como é que isto pode correr mal?
Apesar de todas estas ressalvas, há cenários em que as coisas podem correr muito mal para a comunidade matemática.
O cenário mais provável, na minha opinião, é o seguinte: nos próximos anos, a IA tornar-se-á cada vez mais capaz de resolver problemas matemáticos bem definidos a um nível que rivaliza com os melhores matematos humanos. Isto levará a uma perceção pública de que a IA "resolveu a matemática", apesar de esta ser uma caracterização profundamente enganadora.
Esta perceção terá consequências reais. O financiamento para a investigação em matemática pura diminuirá. Os estudantes evitarão a área. Os matemáticos terão dificuldade em justificar a sua existência.
O resultado será um definhamento lento da comunidade matemática, não porque a IA tenha realmente tornado os matemáticos obsoletos, mas porque a perceção pública — e as decisões de financiamento que dela decorrem — assim o ditarão.
Assumir a verdade
Há alguma coisa que a comunidade matemática possa fazer?
Não vejo uma solução milagrosa, mas há abordagens óbvias para limitar os danos. A primeira é finalmente assumir a verdade sobre a natureza da matemática.
Todos os matemáticos ativos que citei, de Tao a Avigad, de Litt a Kontorovich, têm o cuidado de notar que há algo na matemática que vai além da demonstração de teoremas. No entanto, isto é geralmente apresentado como uma observação passageira, não como uma grande mudança na narrativa.
Bem, isto é uma grande mudança na narrativa, e o público nunca a levará a sério se não for devidamente explicada. Neste momento, parece uma desculpa.
Não se pode reposicionar uma marca plurimilenar sem ser explícito sobre o que se está a fazer, porque se está a fazer e que valor adicional trará para todos. É necessariamente um grande passo, necessariamente difícil, e a janela temporal para o fazer corretamente é extremamente estreita.
Esta pode ser a maior recolha de produto da memória — vendemos uma ideia falsa da matemática a biliões de pessoas, e a conta está a chegar.
A única forma é liderar com a mensagem central e martelá-la vezes sem conta. Deixe-me fazer a minha parte citando outra citação de Thurston (também escolhida por Avigad como epígrafe do seu ensaio recente sobre Compreensão Matemática):
Não estamos a tentar cumprir uma qualquer quota abstrata de produção de definições, teoremas e demonstrações. A medida do nosso sucesso é se aquilo que fazemos permite às pessoas compreender e pensar mais clara e eficazmente sobre matemática.
A longo prazo, isso pode forçar uma repensação completa do ethos e dos critérios de avaliação da profissão. Os matemáticos terão de revogar o código de honra e a segunda lei do Clube da Intuição — "se realmente quiser falar sobre intuição, faça com que pareça casual e acessório, porque não somos o departamento de psicologia." Se Thurston estiver correto, então somos o departamento de psicologia.
Tudo isto é mais fácil de dizer do que fazer. A comunidade matemática não é uma organização estruturada que possa convocar uma reunião de emergência e preparar uma resposta a uma crise.
Nem sequer partilha uma visão unificada da matemática. Alguns pensam genuinamente que o objetivo é "resolver problemas anteriormente não resolvidos", enquanto outros se opõem a qualquer discussão séria sobre intuição. Discordo de ambas as visões, mas a minha opinião não é mais do que isso — uma opinião.
A ausência de uma definição clara e de uma declaração de missão mantém a comunidade na defensiva.
Christian Szegedy, um investigador que foi cofundador da xAI e da Math Inc, fez a previsão de que uma "IA matemática sobre-humana" surgiria até junho de 2026. Este é o tipo de declaração que ou é vazia (os calculadores eletromecânicos são sobre-humanos há um século) ou maximalista da pior forma possível. Não surpreendentemente, Szegedy também escreveu que achava Terry Tao "desligado da realidade que se aproximava rapidamente."
O problema não está na previsão em si (Szegedy tem legitimidade técnica real e direito às suas opiniões, por mais grandiosas que sejam), mas no clima geral que torna muito difícil que uma resposta seja ouvida.
Uma ideia simples a que volto frequentemente é a de que precisamos de algo como uma Escala de Inteligência Matemática, ou Escala de Automação Matemática, como existe para os carros autónomos.
Isso resolveria o perigo iminente de benchmarks objetivos que, pela sua própria natureza, falham em contabilizar a inteligibilidade e a construção de conceitos. Quando a IA esmagar a próxima iteração do First Proof, o comunicado de imprensa deveria ler: "IA resolve o First Proof e atinge o nível 3 (de 10) na Escala de Inteligência Matemática".
Os matemáticos não devem ter medo da subjetividade. Não se trata de batota. Trata-se de ser justo e não cometer seppuku coletivo. Na verdade, qualquer ato de definição de problemas é já subjetivo — não há nada de objetivo nos problemas do First Proof, nos problemas de Erdős ou nos problemas do Prémio do Milénio, exceto o facto de que (em teoria) podemos avaliar objetivamente se algum deles foi resolvido.
Esta qualidade de ser objetivamente verificável está ausente dos aspetos mais profundos da criatividade matemática, como a própria definição de problemas, a canonização e a construção de conceitos, o reenquadramento, a simplificação, a conjetura, até à construção de grandes teorias e à criação de ramos inteiramente novos da matemática — mas isso não significa que estas atividades não existam e não sejam centrais para a matemática.
Há até uma dimensão objetiva na subjetividade matemática. Quando Descartes conectou a álgebra à geometria, quando Newton e Leibniz inventaram o cálculo, ficou bastante claro para os seus contemporâneos que algo importante tinha acontecido. Num certo sentido, toda a nossa tecnoestrutura, incluindo as startups de IA, vive dos dividendos dessas invenções.
Uma escala ideal seria aberta — ou teria degraus superiores aparentemente inacessíveis — já que a matemática não é algo a ser "resolvido".
Sabe-se que a matemática é inesgotável e infinitamente difícil. Isto implica que há espaço para progresso infinito. A única urgência é tornar claro para todos que não é um troféu que está disponível para ser conquistado.
O futuro da matemática
Infelizmente, grande parte dos danos já está incorporada. Mesmo com uma execução perfeita, é impossível conduzir uma revolução epistémica sob a pressão de um cronograma externo. Esta terá de ocorrer num contexto mais amplo que é extremamente desfavorável à ciência fundamental, onde cada nuance é instantaneamente descartada como defesa de interesses.
Serão anos difíceis para os matemáticos. Os estudantes desertarão. O dinheiro secará. Os pós-doutorandos farão perguntas prementes e os docentes seniores terão de arranjar respostas. Nas festas, as pessoas começarão a olhar para eles de forma estranha, como se tivessem tornado fósseis vivos.
No entanto, a certa altura, a pressão aliviar-se-á.
A indústria terá de normalizar e as startups de IA para a matemática terão de encontrar os seus modelos de negócio. Que, muito provavelmente, não serão sobre resolver problemas de Erdős.
Para mim, este pode ser o aspeto mais marcante do momento atual. Por toda a arrogância e fúria, os laboratórios de IA estão mal a envolver-se com a própria matemática, os seus problemas centrais e o seu significado. O que é inteiramente normal, já que isso não é da sua conta.
Quando a poeira assentar, se é que alguma vez assentará, descobriremos que a matemática humana sobreviveu, transformada.
Não farei nenhuma previsão sobre o cronograma, porque não faço ideia. Não sei que capacidades serão alcançadas quando, que avanços permitirão e que limitações aparecerão em retrospetiva.
O que posso dizer é que a mudança já está a ocorrer. Isto é realmente uma revolução científica e a comunidade de investigação começou a envolver-se ativamente com ela. Enquanto escrevia este artigo, via desenvolvimentos notáveis todos os dias no meu timeline. O meu plano inicial era citar os mais impressionantes, mas há demasiados e estou sobrecarregado.
Um pessimista argumentaria que esta é uma resposta induzida pelo medo e um sintoma da disrupção. Estamos a ver o mesmo padrão em todas as indústrias. Quando o capital é realocado tão rapidamente, a uma escala tão massiva, pode não haver forma racional de se preparar para o futuro.
Não me está claro como abordaria isto se não tivesse abandonado a investigação ativa. O fruto mais fácil seria fazer vibe-code de uma formalização do meu ainda não escrito teorema da decomposição celular. Depois poderia testar algumas ideias e conjeturas selvagens. Mas tudo isto é pensamento do velho mundo, e suspeito que até os modos de colaboração e os resultados finais da investigação matemática terão de mudar.
A minha opinião, que dificilmente é original, é que se tornará impensável fazer matemática sem assistência de IA, tal como se tornou impensável fazer matemática sem teoria dos conjuntos e LaTeX.
Mas isto não diz nada sobre os efeitos de segunda ordem. Tentei imaginá-los como um exercício de previsão e cheguei a uma dúzia de ideias, nem todas profundas e nem todas credíveis. Aqui estão três que considero interessantes:
-
Um corte mais claro entre matemática pura e aplicada. Embora ambas mereçam ser tratadas como cidadãos de primeira classe, nunca fiquei satisfeito com a forma tradicional de traçar a linha. A álgebra é considerada pura porque é abstrata, mas pode ser imensamente prática. Por outro lado, os domínios "aplicados" tendem a ter a sua quota-parte de ramificações teóricas. A minha opinião é que a pura e a aplicada devem ser vistas como diferentes pontos ideais no trade-off inteligibilidade-versus-aplicabilidade. É inteiramente racional investir 10 mil milhões de dólares em computação nas equações de confinamento de plasma, se isso acelerar o design de reatores de fusão à escala da rede, mesmo que a inteligibilidade tenha de esperar mais um século ou dois. Não diria o mesmo sobre a hipótese de Riemann.
-
A ascensão dos intuition-maxxers. Para mim, esse seria o sinal mais claro de uma nova Era Dourada. Não os estamos a ver agora porque as poucas pessoas com a combinação rara de competências matemáticas e de agente são caçadas pelos laboratórios de IA. Mas isto é uma anomalia de mercado que provavelmente se corrigirá num futuro próximo (a combinação está a tornar-se menos rara, e os laboratórios de IA só podem absorver um número limitado deles). Suspeito que a IA permitirá a mesma transformação que os samplers e sequenciadores permitiram na música. A barreira técnica para compreender conceitos de fronteira diminuirá, e jovens matemáticos corajosos utilizarão táticas pouco ortodoxas para explorar continentes inteiramente novos a um ritmo que mistificará os seus mais velhos. Eles verão mais longe do que ninguém antes, apoiados nos ombros de máquinas gigantes.
-
Um interesse renovado na filosofia e neurociência da matemática. No seu ensaio de 1979, Reuben Hersh notou que o platonismo e o formalismo eram ambos insustentáveis, e acrescentou este comentário: "Os problemas da verdade e do significado não são questões técnicas em algum ramo recôndito da lógica ou da teoria dos conjuntos. Confrontam qualquer um que use ou ensine matemática. Se quisermos, podemos ignorá-los... Seria surpreendente se isto não tivesse consequências práticas." A IA está a confrontar-nos com uma consequência prática que ninguém6 viu chegar, e que já está a impactar o bem-estar cognitivo da população em geral. Se falharmos em articular o valor neuroplástico da inteligibilidade, não haverá justificação alguma para ensinar matemática, dado que as soluções para todos os problemas matemáticos encontrados por 99,99999% da população ao longo da sua vida estarão disponíveis na ponta dos seus dedos. As pessoas têm uma vaga noção de que isto resultaria em idiocracia, mas não conseguem explicar bem porquê, e ainda temos de encontrar modalidades de ensino e avaliação adaptadas à nova realidade.
O que me preocupa é a falsa crença de que há um nível "normal" de competência matemática, como se certos conceitos fossem mais "reais" ou "concretos" do que outros, e a matemática avançada fosse gratuitamente abstrata. Isto cria a ilusão de que as capacidades atuais (e extremamente insatisfatórias) do público em geral refletem de alguma forma um estado "natural" — quando são, na verdade, o resultado de um investimento pedagógico massivo (embora frustrantemente ineficiente) — e representam um terreno sólido. A verdade é que realmente não há fundo, e nada impede os humanos de funcionar numa cultura onde não há vocabulário para números acima de 5 (como é o caso de algumas tribos de caçadores-recoletores).
Alguns profetizam que a matemática eventualmente se assemelhará ao Xadrez, um desporto que alguns excêntricos praticam com paixão e o público em geral pode ignorar em segurança.
Talvez. Mas esta previsão ignora a incorporação estratégica da ferramenta matemática na ciência e na tecnologia, e a ubiquidade dos processos matemáticos que sustentam silenciosamente a nossa civilização. A analogia com o Xadrez é falha porque a matemática está em todo o lado, e o Xadrez não está. Enquanto a sociedade continuar a precisar de pontes, motores de busca, encriptação e modelos climáticos, continuará a precisar de pessoas que compreendam a matemática subjacente.
Mas, na minha opinião, este é o cerne da questão. Se a matemática é reduzida a teoremas e os teoremas são reduzidos a um problema de pesquisa num espaço de demonstração, então a resposta da IA é inevitável — e a comunidade matemática perdeu a guerra das ideias muito antes de a primeira batalha ter sido travada. A única saída é argumentar que a matemática não é sobre isso.
Isto pode parecer óbvio para os matemáticos, mas não é para o público em geral, nem para os decisores políticos, nem para os investidores que estão a apostar biliões na premissa oposta. E, como vimos, não é óbvio para alguns dos cientistas mais brilhantes do mundo.
A ironia é que a matemática é a disciplina mais resiliente que a humanidade já produziu. Sobreviveu a impérios, guerras, revoluções e mudanças de paradigma. Sobreviverá também a esta. Mas a forma que assumirá — e o lugar que os matemáticos ocuparão nela — depende das escolhas que fizermos agora.
-
Nota do autor: esta é uma prática comum na matemática, onde resultados importantes são frequentemente anunciados informalmente antes de serem publicados formalmente. ↩
-
Thurston está a ecoar a famosa observação de David Hume sobre a razão ser escrava das paixões. ↩
-
Scholze fez esta observação numa entrevista por ocasião da medalha Fields. ↩
-
O autor trabalhou extensivamente com métodos computacionais em teoria de grupos e usou computadores para explorar exemplos e testar conjeturas. ↩
-
Esta é uma referência ao facto de várias startups de "IA para ciência" terem angariado centenas de milhões de dólares em financiamento, apesar de não terem produtos viáveis claros. ↩
-
Hersh não podia ter antecipado o impacto da IA moderna na perceção pública da matemática. ↩