A OpenAI divulgou oficialmente o GPT-5.5 em 23/04, posicionando-o como o modelo principal voltado para trabalho orientado a agentes (agentic) e processamento de conhecimento empresarial, ao mesmo tempo em que estreia no ChatGPT e no Codex. A publicidade oficial define como “nosso modelo mais inteligente e mais intuitivo de usar”, e o AA Intelligence Index lidera com 60 pontos, à frente do Claude Opus 4.7 e do Gemini 3.1 Pro Preview, que ficaram a 3 pontos cada.
Visão geral dos principais dados
Métrica GPT-5.5 em comparação (GPT-5.4 ou concorrentes de mesma categoria) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0 (fluxo de trabalho via linha de comando) 82,7% GPT-5.4:75,1% Expert-SWE (avaliação interna de programação da OpenAI) 73,1% GPT-5.4:68,5% Janela de contexto 12,0 milhões de tokens grande melhora, capaz de processar o repositório inteiro de programas da empresa ou vários horas de vídeo Preço (por milhão de tokens) Entrada 5 dólares, Saída 30 dólares O dobro do preço unitário do GPT-5.4;mas o uso de tokens de saída caiu cerca de 40%, elevando o custo líquido em cerca de 20%
Posicionamento: projetado para a “Era do Agente”
A OpenAI descreve o GPT-5.5 como um modelo base para computação orientada a agentes, capaz de entender objetivos complexos, usar ferramentas, fazer autoinspeção do resultado do trabalho e executar tarefas de vários passos até a conclusão sem que humanos intervenham em cada etapa. De acordo com entrevista do TechCrunch, o presidente Greg Brockman descreveu esta versão como “um grande passo em direção à computação do futuro, mas apenas um”, enfatizando que ela “em comparação com a 5.4 é um raciocinador mais rápido e mais aguçado, usando menos tokens”.
O principal cientista Jakub Pachocki observou que “vemos melhorias bem significativas no curto prazo”; o diretor de pesquisa Mark Chen, por sua vez, destacou que esta versão trouxe “avanços significativos” no fluxo de trabalho de pesquisa científica e técnica.
Escopo de oferta e segmentação por versões
GPT-5.5:Plus, Pro, Business e Enterprise podem usar no ChatGPT e no Codex
GPT-5.5 Pro:versão de raciocínio mais avançada que usuários Pro, Business e Enterprise podem usar no ChatGPT
Integração ao Codex:disponível simultaneamente para as ferramentas de agentes de programação da OpenAI, reforçando edição multiarquivos, linha de comando e ciclos de testes
Aumenta também a retórica sobre cibersegurança e defesa
A integrante da equipe técnica Mia Glaese, em entrevista ao TechCrunch, afirmou que as capacidades de cibersegurança do GPT-5.5 terão “um impacto importante na forma como a OpenAI implantará modelos para investimento em defesa digital”. Esse discurso contrasta diretamente com as controvérsias recentes da Anthropic em torno do modelo de cibersegurança de nível armamentista Claude Mythos — Altman ainda criticou anteriormente a estratégia de “marketing do medo” da Anthropic no programa《Core Memory》. Na GPT-5.5, a OpenAI enfatiza ainda mais a narrativa de “ataque e defesa, e implantável”, com o objetivo de diferenciar-se da postura da Anthropic de limitar o acesso.
Mudança na estratégia de preços
O preço do GPT-5.5 por milhão de tokens dobra para Entrada 5 dólares e Saída 30 dólares, marcando a primeira geração da série GPT-5 em que o preço unitário aumenta de forma significativa. A explicação da OpenAI é que o modelo pode reduzir em cerca de 40% os tokens de saída no quesito eficiência de raciocínio; portanto, a fatura típica de tarefas reais fica aproximadamente 20% mais alta do que a do GPT-5.4, e não simplesmente o dobro. Para empresas, a decisão deixa de ser “se o preço vale a pena” e passa a ser “se, sob o mesmo prompt, o GPT-5.5 consegue concluir tarefas mais complexas com menos tokens no total”.
Sinal para a indústria
O GPT-5.5 amplia a diferença da OpenAI nos benchmarks Terminal-Bench e avaliações internas de SWE; esses dois benchmarks testam, respectivamente, a execução de agentes via linha de comando e tarefas reais de engenharia de software — tornando-se um campo de batalha de pontuação mais direto para confrontos positivos entre Codex e Claude Code. Somado à abertura simultânea da janela de contexto de 12,0 milhões de tokens, a OpenAI pressiona ao mesmo tempo as duas frentes: “processamento completo de bases de conhecimento empresariais” e “agentes de longas tarefas”. Para a Anthropic, o Claude Opus 4.7, com 57 pontos no índice AA, fica 3 pontos atrás; para usuários do Claude Code, há mais um motivo para observar o progresso da próxima geração (Opus 4.8 ou um novo Claude).
Este artigo sobre a OpenAI promovendo o GPT-5.5:12M de contexto, topo no índice AA, Terminal-Bench 82,7% reescreve o benchmark de agentes aparece pela primeira vez em 鏈新聞 ABMedia.
Related Articles
O Projeto Prometheus de Jeff Bezos eleva $10B em $38B de avaliação
OpenAI Lança GPT-5.5, Projetado para Tarefas de Agentes e Fluxos de Trabalho Complexos
Startup de Agentes de IA Band Levanta Rodada Seed de $17M Liderada por Sierra Ventures, Hetz Ventures, Team8
Brecha de Segurança da Vercel se Expande para Centenas de Usuários; Desenvolvedores de IA em Maior Risco
MagicBlock Lança Mirage, Ferramenta de Pagamento de Privacidade via Linha de Comando para Solana