A OpenAI anunciou oficialmente na terça-feira a chegada do ChatGPT Images 2.0, não só melhorando substancialmente a precisão na geração de texto, como também a estética de design em cartazes e retratos. O modelo introduz também pela primeira vez um “modo de pensamento”, que permite que a geração de imagens tenha capacidades de pesquisa na web e de saída em lote de várias imagens, aproximando-se de forma abrangente de cenários de aplicação comerciais.

(A Canva anuncia integração profunda com o Claude, permitindo transformar rascunhos de IA em peças de design prontas)

Do nada até um menu perfeito: a IA finalmente aprendeu a soletrar

Ao recordar há dois anos, os pontos fracos dos modelos de geração de imagens por IA na geração de texto são praticamente do conhecimento geral. Desde que o pedido inclua necessidades de texto, o resultado costuma estar cheio de erros de ortografia absurdos e até de invenções. Isto é ainda mais grave em línguas como o japonês, coreano e chinês, que não são inglês.

Imagem ilustrativa do cartaz oficial em coreano

Agora, o ChatGPT Images 2.0 já consegue gerar um cartaz de divulgação que pode ser usado diretamente pelos operadores, com texto nítido e preciso. Nos últimos anos, os investigadores têm explorado activamente novas arquiteturas como modelos de auto-retroalimentação (Autoregressive Models), e a lógica de funcionamento, a compreensão do texto, as capacidades de geração e de verificação melhoraram de forma significativa.

Modo de pensamento em funcionamento: pesquisa online e consistência na composição, tudo bem resolvido

A actualização mais central do ChatGPT Images 2.0 está no “modo de pensamento (Thinking Capabilities)”, que actualmente está disponível para utilizadores pagantes do ChatGPT Plus, Pro, da versão comercial e da versão empresarial. Após activação, o modelo consegue pesquisar informações na web em tempo real para auxiliar a geração de imagens; também consegue criar descrições visuais correspondentes a partir dos ficheiros enviados pelo utilizador e, antes da saída final, realiza uma auto-revisão e optimização do conteúdo das imagens.

Na geração em lote, no modo de pensamento, com um único pedido é possível produzir até oito imagens de uma só vez, e entre as imagens consegue manter consistentemente as características do personagem, o estilo dos objectos e o estilo global. Isto é adequado para painéis de histórias em quadrinhos, séries de imagens e texto em redes sociais, e até para diagramas de planeamento de espaços em design de interiores de vários ambientes.

Imagem ilustrativa dos painéis de histórias em quadrinhos do anúncio oficial

Em termos de resolução, o novo modelo suporta uma saída máxima de 2K e adiciona várias opções de proporção de aspecto de 3:1 a 1:3, satisfazendo ainda melhor diversas necessidades comerciais.

Línguas asiáticas optimizadas de forma significativa: utilizadores de japonês, chinês e coreano, têm sorte!

Além do inglês, a OpenAI destacou especialmente grandes optimizações do Images 2.0 para textos asiáticos: japonês, coreano e chinês, entre outras, mostram melhorias evidentes.

Um artigo de testes divulgado há alguns dias em comunidades tecnológicas chinesas também confirmou esta notícia. Vários criadores no Zhihu realizaram na altura comparações de testes práticos entre GPT-Image-2 e o concorrente Google Nano Banana Pro, incluindo múltiplos cenários como design de cartazes em chinês, imagens de capas para e-commerce, interfaces de redes sociais e gráficos e tabelas de dados.

Teste do artigo do Zhihu ao GPT-Image 2.0

Os resultados dos testes mostram que o GPT-Image-2 supera claramente o concorrente em beleza da tipografia chinesa, níveis de paginação e sensação geral de design. Os cartazes gerados têm um estilo mais próximo de materiais comerciais reais, em vez de uma saída do tipo “modelo” com um “toque de IA” claramente perceptível. O artigo também aponta que o GPT-Image-2, na reprodução de (como cenas de jogos ou capturas de ecrã de software de comunicação) e na fidelidade de cenários com retratos reais, demonstra também uma maior precisão de detalhes.

ChatGPT Images 2.0 totalmente disponibilizado, API em sincronização

Neste momento, o ChatGPT Images 2.0 já está, desde esta terça-feira, a ser disponibilizado gratuitamente a todos os utilizadores do ChatGPT e do Codex para funcionalidades base. Os utilizadores pagantes podem desbloquear efeitos de saída mais avançados. Ao mesmo tempo, a OpenAI disponibiliza também a API do GPT-Image-2. Os preços são calculados por escalões consoante a qualidade de saída e a resolução, oferecendo flexibilidade de integração para empresas e programadores.

Importa notar que a data-limite de conhecimento do novo modelo é dezembro de 2025. Para pedidos de geração de imagens que envolvam acontecimentos noticiosos recentes, a precisão pode ser limitada até certo ponto. Além disso, a velocidade de geração de composições complexas também não consegue ser tão imediata como uma conversa normal com perguntas e respostas de texto, mas ainda assim bastam apenas alguns minutos.

Este artigo “ChatGPT Images 2.0 em destaque! A precisão da geração de texto melhora bastante, produz com facilidade cartazes de marketing” surge primeiro em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

O Agente de IA já consegue reproduzir autonomamente artigos académicos complexos: Mollick afirma que os erros se devem mais ao texto original humano do que à IA

Agente de IA Notícias da indústria de IA

Mollick indica que os métodos de publicação e os dados, por si só, permitem que agentes de IA reproduzam investigação complexa sem a existência do artigo original e do código; se a reprodução não corresponder ao artigo original, isso deve-se na maioria das vezes a erros no processamento dos dados do próprio artigo ou a uma extrapolação excessiva das conclusões, e não à IA. A Claude primeiro reproduz o artigo, e depois o GPT‑5 Pro faz uma validação cruzada; na maioria dos casos, é bem-sucedido, apenas ficando bloqueado quando os dados são demasiado grandes ou quando há problemas com replication data. Esta tendência reduz drasticamente os custos de mão-de-obra, tornando a reprodução numa verificação geralmente executável, além de colocar desafios institucionais para a revisão pelos pares e para a governação; as ferramentas de governação por parte do governo ou tornar-se-ão numa questão fundamental.

ChainNewsAbmedia32m atrás

OpenAI Integra Codex no Modelo Principal a Partir do GPT-5.4, Descontinua a Linha Separada de Programação

Notícias da indústria de IA

Mensagem da Gate News, 26 de abril — O responsável de developer experience da OpenAI, Romain Huet, revelou numa declaração recente no X que a Codex, a linha de modelos especializados de programação mantida de forma independente pela empresa, foi integrada no modelo principal a partir do GPT-5.4 e deixará de receber atualizações separadas

GateNews32m atrás

Salesforce vai contratar 1.000 graduados e estagiários para produtos de IA, aumenta previsões de receitas para o AF2026

Notícias da indústria de IA

Mensagem do Gate News, 26 de abril — A Salesforce irá contratar 1.000 graduados e estagiários para trabalhar em produtos de IA, incluindo Agentforce e Headless360, à medida que a empresa expande o seu negócio de software de IA, anunciou o CEO Marc Benioff no X. A empresa também aumentou as suas previsões de receitas para o ano fiscal de 2026 para um intervalo entre 41,45 mil milhões de USD e 41,55 mil milhões de USD, acima da sua previsão anterior de 41,1 mil milhões de USD para 41,3 mil milhões de USD.

GateNews34m atrás

Alibaba Cloud Lança Qwen-Image-2.0-Pro com Geração de Texto-para-Imagem e Edição Unificadas, Suportando Renderização de Texto Multilingue

Notícias da indústria de IA

Mensagem de Gate News, 26 de abril — A plataforma Alibaba Cloud Bailian lançou o Qwen-Image-2.0-Pro, uma versão completa da série Qwen-Image-2.0 que combina a geração de texto para imagem e a edição de imagens num único modelo. Os utilizadores podem modificar objetos, texto e estilos diretamente através de comandos em linguagem natural

GateNews2h atrás

A API DeepSeek V4-Pro recebe um desconto de 75% até 5 de Maio; o preço de saída cai para $0.87 por milhão de tokens

Notícias da indústria de IA

Mensagem de Notícias da Gate, 26 de Abril — A DeepSeek anunciou um desconto de 75% por tempo limitado nos preços da API V4-Pro, válido até 5 de Maio às 15:59 UTC. Após o desconto, o preço por milhão de tokens é: cache de entrada (hit) $0.03625

GateNews3h atrás

A Anthropic Implementa Salvaguardas Eleitorais para o Claude Antes das Eleições Gerais de 2026

Notícias da indústria de IA

A Anthropic anunciou na sexta-feira um conjunto de medidas de integridade eleitoral concebidas para impedir que o seu chatbot de IA Claude seja usado como arma para espalhar desinformação ou manipular eleitores antes das eleições legislativas intercalares dos EUA de 2026 e de outras grandes contendas a nível mundial este ano. A sede da San Francisco-based

CryptoFrontier9h atrás

Comentar

0/400

Nenhum comentário