Humanos vencem a IA na Olimpíada Anual de Matemática, mas as máquinas estão alcançando

/ CBS/AFP
Sydney — Humanos superaram modelos de IA generativa feitos pelo Google e OpenAI em uma competição internacional de matemática de alto nível, mas os programas alcançaram pontuações de nível ouro pela primeira vez, e a velocidade com que eles estão melhorando pode ser motivo para alguma introspecção humana.
Nenhum dos modelos de IA obteve nota máxima — ao contrário de cinco jovens na Olimpíada Internacional de Matemática (IMO), uma prestigiosa competição anual onde os participantes devem ter menos de 20 anos.
O Google disse na segunda-feira que uma versão avançada do seu chatbot Gemini resolveu cinco dos seis problemas de matemática apresentados na IMO, realizada em Queensland, Austrália, neste mês.
"Podemos confirmar que o Google DeepMind atingiu o tão desejado marco, conquistando 35 dos 42 pontos possíveis — uma medalha de ouro", disse a gigante da tecnologia americana, citando o presidente da IMO, Gregor Dolinar. "Suas soluções foram surpreendentes em muitos aspectos. Os avaliadores da IMO as consideraram claras, precisas e, na maioria, fáceis de acompanhar."
Cerca de 10% dos competidores humanos ganharam medalhas de nível ouro, e cinco receberam pontuações perfeitas de 42 pontos.
A OpenAI, fabricante do ChatGPT dos EUA, disse que seu modelo de raciocínio experimental também obteve a pontuação nível ouro de 35 pontos no teste.
O resultado "superou um grande desafio de longa data em IA" na "competição de matemática mais prestigiada do mundo", disse o pesquisador da OpenAI Alexander Wei em uma publicação nas redes sociais.
"Avaliamos nossos modelos nos problemas da IMO de 2025 sob as mesmas regras dos competidores humanos", disse ele. "Para cada problema, três ex-medalhistas da IMO avaliaram independentemente a prova apresentada pelo modelo."
O Google conquistou uma medalha de prata na IMO do ano passado, na cidade de Bath, no sudoeste da Inglaterra, resolvendo quatro dos seis problemas.
Isso levou de dois a três dias de computação — muito mais do que neste ano, quando seu modelo Gemini resolveu os problemas dentro do limite de tempo de 4,5 horas, disse ele.
A OMI disse que empresas de tecnologia "testaram privadamente modelos de IA de código fechado sobre os problemas deste ano", os mesmos enfrentados por 641 estudantes concorrentes de 112 países.
"É muito emocionante ver o progresso nas capacidades matemáticas dos modelos de IA", disse o presidente da IMO, Dolinar.
Os organizadores do concurso não conseguiram verificar quanta capacidade de computação havia sido usada pelos modelos de IA ou se houve envolvimento humano, ele observou.
Em uma entrevista ao programa 60 Minutes da CBS no início deste ano, um dos principais pesquisadores de IA do Google previu que, dentro de apenas cinco a 10 anos, seriam produzidos computadores com capacidades cognitivas de nível humano — um marco conhecido como "inteligência geral artificial".
O CEO do Google DeepMind , Demis Hassabis, previu que a tecnologia de IA estava a caminho de entender o mundo de maneiras diferenciadas e não apenas resolver problemas importantes, mas até mesmo desenvolver um senso de imaginação, dentro de uma década, graças ao aumento do investimento.
"Está avançando incrivelmente rápido", disse Hassabis. "Acho que estamos em uma espécie de curva exponencial de melhoria. É claro que o sucesso da área nos últimos anos atraiu ainda mais atenção, mais recursos e mais talentos. Isso contribui para esse progresso exponencial."
Cbs News