OpenAIは火曜日に正式にChatGPT Images 2.0を公開し、文字生成の正確度だけでなく、ポスターや人物画像におけるデザインの美しさも大幅に向上させました。このモデルはまた初めて「思考モード」を導入し、画像生成にネット検索や複数枚の一括出力の能力を持たせ、商用アプリケーションのシナリオに全面的に近づけています。

(CanvaがClaudeを深く統合すると発表し、AIの下書きをデザインの完成品へ変換する)

でたらめの創作から完璧なメニューへ：AIはついに「綴り」を覚えた

2年前を振り返ると、AIの画像生成モデルの文字生成における弱点はほぼ誰もが知っていました。プロンプトに文字の要件が含まれているだけで、出力結果には不条理な綴りミスやでたらめな創作がしばしば混ざり、英語以外の中国語・日本語・韓国語の言語ではさらに深刻でした。

公式発表の韓国語ポスターのイメージ図

いまや、ChatGPT Images 2.0は、事業者がそのまま利用できる宣伝用ポスターを1枚生成でき、文字は明確で正確です。研究者たちは近年、自身に自己回帰するモデル (Autoregressive Models) などの新しいアーキテクチャを積極的に探求しており、その動作ロジックや文字の理解、生成・検証能力が顕著に向上しています。

思考モードがオンライン：連網検索、構図の一貫性まですべて対応

ChatGPT Images 2.0の最も重要なアップグレードは「思考モード (Thinking Capabilities)」で、現在はChatGPT Plus、Pro、商用版、企業版の有料ユーザーに提供されています。これを有効にすると、モデルは画像生成を補助するためにリアルタイムでネット検索を行えるほか、ユーザーがアップロードしたファイルに基づいて対応する視覚的な説明図を作成し、正式な出力の前に画像内容を自己審査して最適化します。

大量生成の面では、思考モード下での単一プロンプトあたりの最大出力は一度に8枚の画像で、各画像の間で一貫したキャラクターの姿、物のスタイル、全体的なテイストを維持できるため、漫画の分割コマ、ソーシャルメディアの連載用の図と文章、さらには室内デザインの各空間の企画図にも適しています。

公式発表の漫画分割コマのイメージ図

解像度の面では、新モデルは最高2K出力に対応し、さらに3:1から1:3までの複数の縦横比オプションを追加して、さまざまな商用ニーズをより一層満たします。

アジア言語が大幅に最適化され、中日韓ユーザーに朗報！

英語以外に、OpenAIはImages 2.0がアジアの文字において重大な最適化を実施したと特別に指摘しており、日本語、韓国語、中国語などで明らかな改善が見られます。

数日前に中国のテクノロジー系コミュニティで拡散されたテスト記事も、この情報を裏づけており、複数の知乎のクリエイターが当時GPT-Image-2と競合のGoogle Nano Banana Proの実測比較を行いました。これには、中国語ポスターのデザイン、ECの表紙画像、ソーシャルメディアのインターフェース、データ化されたグラフなど、多様なシーンが含まれます。

知乎の記事のテスト：GPT-Image 2.0

テスト結果は、GPT-Image-2が中国語の文字の書体の美しさ、レイアウト階層、全体のデザイン感のいずれにおいても明確に優れていることを示しています。生成されたポスターのテイストは、明らかな「AI感」があるテンプレート式の出力ではなく、実際の商用素材により近いものになっています。記事では同時に、GPT-Image-2がインターフェースの再現、つまり「ゲーム画面やコミュニケーションアプリのスクリーンショット」(と真の人物のシーンの再現においても、より高いディテールの精度を示したと述べています。

ChatGPT Images 2.0が全面的に開放され、APIも同時に上線

現時点で、ChatGPT Images 2.0は今週火曜日からすべてのChatGPTおよびCodexユーザーに基礎機能を無料提供しています。有料ユーザーは、より高度な出力効果を解放できます。同時に、OpenAIもGPT-Image-2のAPIを開放しており、価格は出力品質と解像度に応じて段階的に計算され、企業側と開発者に統合の柔軟性を提供します。

注目すべき点として、新しいモデルの知識の締め切り日は2025年12月であり、最新の時事に関わる画像生成プロンプトでは、正確度に一定の制限がかかる可能性があります。さらに、複雑な構図の生成速度も、一般的な文字の質疑応答ほどは即時ではありませんが、それでも数分で済みます。

この記事：ChatGPT Images 2.0登場！文字生成の正確度が大幅に向上し、簡単に販促用ポスターを作成最初に登場したのは鏈新聞 ABMediaです。

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

AIエージェントは、複雑な学術論文を独力で再現できるようになっている：Mollickは、誤りはAIではなく人間の原文に多いと述べている

AIエージェント AI業界ニュース

Mollick は、公開された手法とデータだけで、AI agent が元の論文やコードがない状況でも複雑な研究を再現できると指摘している。再現が原論文と一致しない場合は、多くの場合 AI ではなく、論文自体のデータ処理の誤り、または結論の過度な解釈によるものだという。Claude はまず論文を再現し、その後 GPT‑5 Pro によるクロス検証を行い、多くは成功するが、データが大きすぎる場合や replication data の問題がある場合には阻まれることがある。この傾向は人力コストを大幅に下げ、再現が一般的に実行可能な検証となり得ることを示すとともに、査読やガバナンスの制度上の課題も提起しており、政府のガバナンスツール、あるいはそれに関連する事項が重要な論点となっている。

ChainNewsAbmedia32分前

OpenAI、GPT-5.4を起点にCodexをメインモデルに統合し、独立したコーディング系統を終了

AI業界ニュース

Gate News メッセージ、4月26日—OpenAIの開発者エクスペリエンス責任者ロマン・ユエ（Romain Huet）が、Xでの最近の声明の中で、同社が独立して保守してきた専用のコーディングモデル系列であるCodexが、GPT-5.4からメインモデルに統合され、今後は別個の

GateNews32分前

SalesforceがAIプロダクト向けに卒業生・インターン1,000人を採用し、FY2026の売上高見通しを引き上げ

AI業界ニュース

ゲートニュース、4月26日 — Salesforceは、AIソフトウェア事業を拡大する中で、AgentforceやHeadless360を含むAIプロダクトに取り組むために、卒業生およびインターンを1,000人採用すると発表した。CEOのMarc BenioffがXで明らかにした。同社はまた、2026会計年度の売上高見通しを、US$41.45 bからUS$41.55 bの範囲へと引き上げた

GateNews34分前

Alibaba Cloudが統合型のテキストから画像生成と編集を搭載したQwen-Image-2.0-Proを発表、多言語テキスト表示に対応

AI業界ニュース

Gate Newsのメッセージ、4月26日 — Alibaba Cloud Bailianプラットフォームは、テキストから画像生成と画像編集を単一モデルで統合した、Qwen-Image-2.0シリーズの高機能版であるQwen-Image-2.0-Proをリリースしました。ユーザーは、自然言語コマンドを通じてツールを切り替えることなく、オブジェクト、テキスト、スタイルを直接変更できます。

GateNews2時間前

DeepSeek V4-Pro APIが5月5日まで75%割引、出力価格は100万トークンあたり$0.87に低下

AI業界ニュース

Gateニュースメッセージ、4月26日 — DeepSeekはV4-Pro API料金に期間限定で75%の割引を発表し、5月5日15:59 UTCまで有効です。割引後の100万トークンあたりの料金は：入力キャッシュヒット $0.03625

GateNews3時間前

Anthropic、2026年の中間選挙に先駆けてClaude向けに選挙の安全対策を導入

AI業界ニュース

Anthropicは金曜日、2026年の米国中間選挙や今年世界中で行われるその他の主要な選挙を前に、同社のClaude AIチャットボットが武器化されて誤情報を拡散したり、有権者を操作したりすることを防ぐことを目的とした、一連の選挙の信頼性に関する施策を発表した。サンフランシスコ拠点の

CryptoFrontier9時間前

0/400

コメントなし