
Humanos superam IA em olimpíada internacional de matemática

Mesmo com pontuações dignas de medalha de ouro, modelos de inteligência artificial do Google e da OpenAI foram derrotados por humanos na Olimpíada Internacional de Matemática (IMO), uma das competições mais prestigiadas do mundo, divulgou a AFP
Cinco jovens participantes, todos com menos de 20 anos, conquistaram pontuação máxima. Nenhum dos modelos de IA conseguiu resolver todas as questões.

O Google informou nesta segunda-feira que uma versão avançada de seu chatbot Gemini resolveu 5 dos 6 problemas propostos na IMO, realizada neste mês em Queensland, na Austrália.
"Podemos confirmar que o Google DeepMind alcançou a cobiçada marca de 35 pontos, o que equivale a uma medalha de ouro", disse o presidente da IMO, Gregor Dolinar, segundo a empresa. "As soluções foram impressionantes em vários aspectos: claras, precisas e, em sua maioria, fáceis de acompanhar."
Cerca de 10% dos competidores humanos ganharam medalha de ouro. Cinco atingiram a pontuação perfeita: 42 pontos.
A OpenAI, criadora do ChatGPT, afirmou que seu modelo experimental de raciocínio também alcançou 35 pontos.
"O resultado representa a conquista de um grande desafio da IA na competição de matemática mais prestigiada do mundo", escreveu o pesquisador da OpenAI, Alexander Wei, nas redes sociais. Segundo ele, três ex-medalhistas da IMO corrigiram, de forma independente, as provas resolvidas pelo modelo.
No ano passado, o Google havia conseguido apenas medalha de prata, resolvendo 4 dos 6 problemas na edição realizada em Bath, no Reino Unido. Na época, a computação levou de dois a três dias. Este ano, o Gemini concluiu os problemas dentro do limite de 4h30.
Segundo a IMO, as empresas de tecnologia testaram seus modelos de forma privada, usando os mesmos desafios enfrentados pelos 641 estudantes de 112 países. O presidente da competição celebrou os avanços da IA, mas fez um alerta: os organizadores não conseguiram verificar quanta potência computacional foi usada nem se houve intervenção humana.
