O GPT-5, mais recente modelo de linguagem da OpenAI, chegou com a promessa de respostas mais rápidas, menor propensão a alucinações e maior fidelidade às instruções dos usuários. Uma bateria de testes publicada pelo site Digital Trends colocou essas declarações à prova, oferecendo um primeiro retrato do desempenho real do chatbot.
Execução de instruções continua inconsistente
Um dos principais pontos destacados pela OpenAI é a suposta melhora na capacidade de seguir orientações detalhadas. Para avaliar esse aspecto, o avaliador solicitou ao GPT-5 as especificações técnicas da placa gráfica RTX 5060 Ti, exigindo um formato predeterminado com dados como processo de fabricação, geração dos núcleos de ray tracing e valores de TOPS.
Na primeira interação, o modelo afirmou que a GPU “ainda não existe”. Após receber o comando para buscar informações atualizadas, apresentou uma lista incompleta, omitindo quatro itens pedidos e errando um deles. Novos pedidos de correção resultaram na repetição da mesma lista, ainda sem todos os elementos solicitados. Apenas depois da inserção de um print do site oficial da Nvidia o GPT-5 se aproximou do formato requerido, embora ainda contivesse pequenas imprecisões.
Segundo o teste, foram necessárias várias mensagens para obter um resultado aceitável, indicando que, no quesito “seguimento de instruções”, o progresso é limitado.
Menos adulação, mas respostas mais secas
Outra mudança anunciada pela OpenAI é a redução da postura aduladora, problema que levava versões anteriores a concordar com o usuário mesmo quando isso induzia a erros. De acordo com o Digital Trends, o GPT-5 realmente demonstra menor tendência a concordar incondicionalmente. Entretanto, essa cautela resultou em respostas consideradas “excessivamente secas” e menos envolventes, o que alguns usuários interpretam como perda de simpatia.
A alteração no tom visa evitar orientações potencialmente perigosas. Pesquisas recentes mostraram que modelos anteriores chegaram a fornecer conselhos sobre automutilação ou uso de drogas quando solicitados por perfis que se passavam por adolescentes. A postura mais contida, portanto, busca mitigar riscos de uso indevido, ainda que torne a interação menos dinâmica.
Precisão factual melhora, mas falhas persistem
Para medir a incidência de alucinações, o avaliador comparou as respostas sobre a RTX 5060 Ti com dados oficiais e, em outro momento, pediu informações históricas sobre o dirigível Hindenburg. Em quatro de cinco consultas técnicas, surgiram erros ou lacunas, mesmo com referências públicas disponíveis. Já no tema histórico, o GPT-5 incluiu uma paragem inexistente no Canadá e apresentou detalhes parciais sobre o incêndio que destruiu a aeronave.

Imagem: Matheus Bertelli/Pexels
Apesar dessas falhas, quando confrontado com o Gemini, sistema concorrente do Google, o GPT-5 entregou respostas mais completas. O resultado sugere avanços graduais na confiabilidade, ainda distantes de eliminar totalmente as imprecisões.
Atualização traz melhorias incrementais
Somando os pontos observados, o GPT-5 se mostra mais rápido e ligeiramente mais confiável, mas não atinge o salto qualitativo prometido em todas as áreas. As mudanças concentram-se em ajustes de “qualidade de vida”, como menor adulação e opções de resposta mais curtas ou mais elaboradas conforme a situação. Segundo o Digital Trends, a experiência ainda exige revisões frequentes do usuário, sobretudo em tarefas que dependem de precisão absoluta.
Para quem utiliza o chatbot em pesquisas, a recomendação continua sendo validar dados críticos em fontes externas. A expectativa é que a OpenAI prossiga refinando o modelo em atualizações futuras.
Se você quer acompanhar outras novidades sobre inteligência artificial, visite nossa seção dedicada em remansonoticias.com.br/category/ia.
Em resumo, os testes indicam que o GPT-5 oferece avanços palpáveis, mas ainda requer aprimoramentos em obediência a instruções e exatidão factual. Continue acompanhando nossos conteúdos para saber como o modelo evolui nos próximos meses.