OpenAI lança GPT-5.5: contexto de 12M, índice AA em primeiro lugar, Terminal-Bench 82,7% reescreve o benchmark de agentes

A OpenAI divulgou oficialmente o GPT-5.5 em 23/04, posicionando-o como o modelo principal voltado para trabalho orientado a agentes (agentic) e processamento de conhecimento empresarial, ao mesmo tempo em que estreia no ChatGPT e no Codex. A publicidade oficial define como “nosso modelo mais inteligente e mais intuitivo de usar”, e o AA Intelligence Index lidera com 60 pontos, à frente do Claude Opus 4.7 e do Gemini 3.1 Pro Preview, que ficaram a 3 pontos cada.

Visão geral dos principais dados

Métrica GPT-5.5 em comparação (GPT-5.4 ou concorrentes de mesma categoria) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0 (fluxo de trabalho via linha de comando) 82,7% GPT-5.4:75,1% Expert-SWE (avaliação interna de programação da OpenAI) 73,1% GPT-5.4:68,5% Janela de contexto 12,0 milhões de tokens grande melhora, capaz de processar o repositório inteiro de programas da empresa ou vários horas de vídeo Preço (por milhão de tokens) Entrada 5 dólares, Saída 30 dólares O dobro do preço unitário do GPT-5.4;mas o uso de tokens de saída caiu cerca de 40%, elevando o custo líquido em cerca de 20%

Posicionamento: projetado para a “Era do Agente”

A OpenAI descreve o GPT-5.5 como um modelo base para computação orientada a agentes, capaz de entender objetivos complexos, usar ferramentas, fazer autoinspeção do resultado do trabalho e executar tarefas de vários passos até a conclusão sem que humanos intervenham em cada etapa. De acordo com entrevista do TechCrunch, o presidente Greg Brockman descreveu esta versão como “um grande passo em direção à computação do futuro, mas apenas um”, enfatizando que ela “em comparação com a 5.4 é um raciocinador mais rápido e mais aguçado, usando menos tokens”.

O principal cientista Jakub Pachocki observou que “vemos melhorias bem significativas no curto prazo”; o diretor de pesquisa Mark Chen, por sua vez, destacou que esta versão trouxe “avanços significativos” no fluxo de trabalho de pesquisa científica e técnica.

Escopo de oferta e segmentação por versões

GPT-5.5:Plus, Pro, Business e Enterprise podem usar no ChatGPT e no Codex

GPT-5.5 Pro:versão de raciocínio mais avançada que usuários Pro, Business e Enterprise podem usar no ChatGPT

Integração ao Codex:disponível simultaneamente para as ferramentas de agentes de programação da OpenAI, reforçando edição multiarquivos, linha de comando e ciclos de testes

Aumenta também a retórica sobre cibersegurança e defesa

A integrante da equipe técnica Mia Glaese, em entrevista ao TechCrunch, afirmou que as capacidades de cibersegurança do GPT-5.5 terão “um impacto importante na forma como a OpenAI implantará modelos para investimento em defesa digital”. Esse discurso contrasta diretamente com as controvérsias recentes da Anthropic em torno do modelo de cibersegurança de nível armamentista Claude Mythos — Altman ainda criticou anteriormente a estratégia de “marketing do medo” da Anthropic no programa《Core Memory》. Na GPT-5.5, a OpenAI enfatiza ainda mais a narrativa de “ataque e defesa, e implantável”, com o objetivo de diferenciar-se da postura da Anthropic de limitar o acesso.

Mudança na estratégia de preços

O preço do GPT-5.5 por milhão de tokens dobra para Entrada 5 dólares e Saída 30 dólares, marcando a primeira geração da série GPT-5 em que o preço unitário aumenta de forma significativa. A explicação da OpenAI é que o modelo pode reduzir em cerca de 40% os tokens de saída no quesito eficiência de raciocínio; portanto, a fatura típica de tarefas reais fica aproximadamente 20% mais alta do que a do GPT-5.4, e não simplesmente o dobro. Para empresas, a decisão deixa de ser “se o preço vale a pena” e passa a ser “se, sob o mesmo prompt, o GPT-5.5 consegue concluir tarefas mais complexas com menos tokens no total”.

Sinal para a indústria

O GPT-5.5 amplia a diferença da OpenAI nos benchmarks Terminal-Bench e avaliações internas de SWE; esses dois benchmarks testam, respectivamente, a execução de agentes via linha de comando e tarefas reais de engenharia de software — tornando-se um campo de batalha de pontuação mais direto para confrontos positivos entre Codex e Claude Code. Somado à abertura simultânea da janela de contexto de 12,0 milhões de tokens, a OpenAI pressiona ao mesmo tempo as duas frentes: “processamento completo de bases de conhecimento empresariais” e “agentes de longas tarefas”. Para a Anthropic, o Claude Opus 4.7, com 57 pontos no índice AA, fica 3 pontos atrás; para usuários do Claude Code, há mais um motivo para observar o progresso da próxima geração (Opus 4.8 ou um novo Claude).

Este artigo sobre a OpenAI promovendo o GPT-5.5:12M de contexto, topo no índice AA, Terminal-Bench 82,7% reescreve o benchmark de agentes aparece pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O Projeto Prometheus de Jeff Bezos eleva $10B em $38B de avaliação

Mensagem do Gate News, 24 de abril — O Projeto Prometheus, um laboratório de IA fundado pelo fundador da Amazon Jeff Bezos e pelo ex-executivo do Google Vik Bajaj, encerrou uma rodada de financiamento de $10 bilhões em uma avaliação de $38 bilhões. JPMorgan Chase e BlackRock são

GateNews2h atrás

OpenAI Lança GPT-5.5, Projetado para Tarefas de Agentes e Fluxos de Trabalho Complexos

Mensagem do Gate News, 24 de abril — A OpenAI lançou oficialmente o GPT-5.5, um modelo de IA de próxima geração projetado para lidar com objetivos complexos, integração de ferramentas, auto-verificação e conclusão de tarefas em várias etapas. O modelo se destaca na escrita de código e depuração, pesquisa online, análise de dados, criação de documentos

GateNews3h atrás

Startup de Agentes de IA Band Levanta Rodada Seed de $17M Liderada por Sierra Ventures, Hetz Ventures, Team8

Mensagem de Gate News, 24 de abril — A Band, uma startup que está construindo uma plataforma de comunicação e colaboração para agentes de IA, fechou uma rodada seed de $17 milhões liderada pela Sierra Ventures, Hetz Ventures e Team8. Fundada em meados de 2025 pelo CEO Arick Goomanovsky e pelo CTO Vlad Luzin, a empresa desenvolve software para re

GateNews3h atrás

Brecha de Segurança da Vercel se Expande para Centenas de Usuários; Desenvolvedores de IA em Maior Risco

Mensagem do Gate News, 23 de abril — A Vercel revelou em 19 de abril que seu incidente de segurança, inicialmente descrito como afetando um "subconjunto limitado de clientes", se expandiu para uma comunidade de desenvolvedores muito mais ampla, especialmente aqueles que estão construindo fluxos de trabalho de agentes de IA. O ataque pode afetar centenas de usuários

GateNews8h atrás

MagicBlock Lança Mirage, Ferramenta de Pagamento de Privacidade via Linha de Comando para Solana

Mensagem de Notícias da Gate, 23 de abril — A MagicBlock lançou o Mirage, uma ferramenta de pagamento de privacidade via linha de comando projetada para a rede Solana. A ferramenta permite que os usuários criem carteiras, depositem fundos e enviem transações privadas por meio de comandos de terminal, bots ou agentes de IA. Mirage é construído sobre o Private

GateNews13h atrás
Comentário
0/400
Sem comentários