OpenAI censura ChatGPT após estranha obsessão por duendes

A empresa OpenAI publicou recentemente um relatório curioso sobre um comportamento incomum em seus modelos de inteligência artificial (IA), caracterizado por um aumento nas referências a "duendes" e outras criaturas míticas em respostas nas quais elas não eram necessárias.

Em novembro do ano passado, após o lançamento do ChatGPT-5.1, alguns usuários começaram a notar um tom estranhamente repetitivo em algumas respostas oferecidas pelo sistema, o que levou a equipe de segurança a investigar a origem desses "tiques verbais". De acordo com uma análise interna, o uso do termo "duende" aumentou 175%, enquanto "gremlin" cresceu 52% em comparação com versões anteriores.

A origem do problema

Embora, inicialmente, o surgimento dessas palavras não tenha causado grande preocupação, com o tempo sua frequência tornou-se mais evidente e preocupante. Após uma nova investigação, a OpenAI identificou que a origem do problema estava relacionada à configuração de personalidade do modelo, especialmente ao perfil denominado "Nerdy".

Esse estilo de personalidade, projetado para ser brincalhão e sábio, recebia sinais de recompensa pelo uso de linguagem engenhosa e metáforas associadas a criaturas fictícias. Esse comportamento acabou se espalhando por todo o modelo quando os processos de aprendizado por reforço associados ao perfil "Nerdy" foram incorporados ao treinamento geral.

Em resposta, a OpenAI retirou a personalidade "Nerdy" em março passado, após o lançamento do ChatGPT-5.4. Também aplicou filtros nos dados de treinamento para reduzir as referências a duendes e gremlins em contextos inadequados.