Lançamento do modelo GPT 5.5: foco em programação de pesquisa! Veja uma comparação das diferenças com Claude Opus 4.7

OpenAI lançamento surpresa do modelo GPT-5.5, com foco na capacidade mais poderosa e intuitiva de escrever códigos e operar entre ferramentas, este artigo apresenta uma comparação de desempenho entre o GPT-5.5, Claude Opus 4.7 e Gemini 3.1 Pro, modelos principais.

OpenAI apresenta o GPT-5.5! Veja suas características de uma só vez

A gigante de IA OpenAI lançou de surpresa na madrugada do horário de Taiwan, 24 de abril, o novo modelo GPT-5.5, afirmando ser o sistema de IA mais inteligente e mais intuitivo até hoje.

OpenAI afirma que o modelo GPT-5.5 possui uma poderosa capacidade de programação de agentes de IA, especializado em lidar com código, além de bugs, pesquisa online e operação entre ferramentas.

Em comparação com a versão anterior GPT-5.4, o GPT-5.5 mantém o mesmo nível de latência de processamento, podendo completar tarefas com menos marcações.

O presidente da OpenAI, Greg Brockman, destacou que o novo modelo é um avanço importante rumo ao processamento intuitivo, além de ser uma etapa crucial na criação de uma superaplicação que combina ChatGPT, Codex e navegador de IA.

Planos de custos e permissões de uso do GPT-5.5

A partir de agora, usuários do ChatGPT Plus, Pro, Business e Enterprise, bem como usuários do Codex, podem usar o GPT-5.5, enquanto a versão avançada GPT-5.5 Pro está disponível para usuários Pro, Business e Enterprise.

No que diz respeito à precificação da API, o custo por token de entrada do GPT-5.5 é de 5 dólares por 1 milhão de tokens, e para saída, 30 dólares por 1 milhão de tokens. Para o GPT-5.5 Pro, o custo de entrada é de 30 dólares por 1 milhão de tokens, e de saída, 180 dólares por 1 milhão de tokens.

Curiosamente, o lançamento do GPT-5.5 coincide com uma disputa judicial entre Elon Musk e o CEO da OpenAI, Sam Altman, atraindo atenção do público.

Desempenho nos testes de benchmark do GPT-5.5: análise de vantagens e desvantagens

Nos testes de desempenho (Benchmark), o GPT-5.5 demonstra vantagens técnicas, embora ainda enfrente desafios em algumas áreas.

De acordo com dados oficiais da OpenAI, o GPT-5.5 atingiu uma precisão de 82,7% no Terminal-Bench 2.0, que avalia comandos complexos; e obteve 84,9% na avaliação de trabalhos de conhecimento GDPval, mostrando alta utilidade para tarefas diárias de escritório.

Nos testes públicos do SWE-Bench Pro, que avaliam problemas reais do GitHub, o GPT-5.5 obteve 58,6%, ligeiramente atrás do Claude Opus 4.7, lançado pela Anthropic, com 64,3%.

A OpenAI observa que os testes podem ser influenciados pelo efeito de memória do modelo, mas ainda assim refletem que o GPT-5.5 apresenta desvantagens na resolução de bugs específicos de desenvolvimento.

Fonte da imagem: Desempenho nos testes de benchmark do GPT-5.5 da OpenAI: análise de vantagens e desvantagens

Na área de segurança cibernética, a Anthropic lançou recentemente o modelo Claude Mythos Preview, focado em alta segurança, enquanto o GPT-5.5, embora tenha melhorado suas defesas, atualmente é disponibilizado apenas por canais específicos para empresas certificadas, para proteção de infraestrutura.

Comparação entre modelos principais: GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro

Comparação de dados entre GPT-5.5 e Claude Opus 4.7

Com base em testes oficiais da OpenAI e ITmedia, na avaliação OSWorld-Verified, que simula ambientes reais de computador, o GPT-5.5 obteve 78,7%, ligeiramente à frente do Claude Opus 4.7, com 78,0%.

No teste de raciocínio lógico avançado e colaboração com ferramentas, BrowseComp, o GPT-5.5 atingiu 84,4%, superando o Claude Opus 4.7, com 79,3%; e nos testes de matemática avançada FrontierMath Tier 1 a 3, o GPT-5.5 marcou 51,7%, superando o Claude Opus 4.7, com 43,8%.

Comparação de dados entre GPT-5.5 e Gemini 3.1 Pro

Em relação ao Gemini 3.1 Pro, o GPT-5.5 mantém vantagem na maioria dos testes profissionais. No teste GDPval de trabalhos de conhecimento, o GPT-5.5 atingiu 84,9%, enquanto o Gemini 3.1 Pro ficou em 67,3%.

No avaliação de uso de ferramentas externas Toolathlon, o GPT-5.5 obteve 55,6%, superior ao Gemini 3.1 Pro, com 48,8%.

Fonte da imagem: Comparação de dados entre GPT-5.5 e Gemini 3.1 Pro

No teste multimodal MMMU Pro sem auxílio de ferramentas, o GPT-5.5 alcançou 81,2%, enquanto o Gemini 3.1 Pro obteve 80,5%, desempenho bastante próximo.

GPT-5.5 está preparando o caminho para IPO?

O chefe de pesquisa da OpenAI, Mark Chen, afirmou que, o GPT-5.5 traz melhorias substanciais nos processos de pesquisa científica e tecnológica, podendo ajudar cientistas a acelerar descobertas, como na área de desenvolvimento de medicamentos.

O site The Verge destacou que o lançamento deste novo modelo reflete a disputa entre OpenAI e Anthropic pelo domínio do mercado de ferramentas de IA corporativa, além de preparar o terreno para uma possível abertura de capital (IPO) ainda neste ano, com ambos os lados em uma competição cada vez mais acirrada.

Leitura adicional:
Como usar o ChatGPT Images 2.0? Teste com cardápio de ramen, capa de revista, e efeitos de divulgação científica em múltiplos idiomas

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar