OpenAI во вторник официально выпустила ChatGPT Images 2.0, что не только значительно повышает точность генерации текста, но и улучшает дизайнерскую привлекательность на постерах и портретах. Эта модель впервые также вводит «режим мышления», благодаря которому генерация изображений получает возможности сетевого поиска и пакетного вывода нескольких изображений, вплотную приближаясь к сценариям коммерческого применения.

(Canva объявила о глубокой интеграции Claude, позволяя преобразовывать AI-черновики в готовые дизайнерские продукты)

От выдумывания с нуля до идеального меню: AI наконец научился писать без ошибок

Вспомните два года назад: слабые места моделей генерации изображений на основе текста были почти всем очевидны. Если в подсказке были требования к тексту, результаты часто изобиловали абсурдными орфографическими ошибками или даже выдумками. В неанглоязычных языках, таких как китайский, японский и корейский, эта проблема была еще более выраженной.

Официальный анонс: схематичный пример корейского постера

Сегодня ChatGPT Images 2.0 уже может генерировать рекламный постер, который можно сразу использовать поставщикам, а текст получается четким и точным. Исследователи в последние годы активно изучают новые архитектуры с самообращением, такие как (Autoregressive Models), и благодаря этому заметно улучшились логика работы, понимание текста, а также возможности генерации и верификации.

Режим мышления запущен: подключенный поиск и согласованность композиции — все на месте

Самое ключевое обновление ChatGPT Images 2.0 — это «режим мышления (Thinking Capabilities)». Сейчас он доступен оплачивающим пользователям ChatGPT Plus, Pro, коммерческой версии и корпоративной версии. После включения модель может в реальном времени выполнять сетевой поиск информации для поддержки генерации изображений, а также создавать соответствующие визуальные пояснительные изображения на основе файлов, загруженных пользователем, и перед официальным выводом проводить самопроверку и оптимизацию содержимого изображений.

При пакетной генерации в режиме мышления одна подсказка максимум позволяет за один раз вывести до восьми изображений, и между ними сохраняются согласованные образы персонажей, стили объектов и общий художественный стиль. Это подходит для раскадровок комиксов, серийных иллюстраций и текстов для социальных сетей, а также даже для план-схем всех помещений в интерьерном дизайне.

Официальный анонс: схематичный пример раскадровки комикса

По разрешению новая модель поддерживает вывод до 2K и добавляет различные варианты соотношения сторон от 3:1 до 1:3, еще больше удовлетворяя разные коммерческие потребности.

Значительное улучшение для азиатских языков — китайско-японско-корейным пользователям повезло!

Помимо английского, OpenAI особо отмечает, что Images 2.0 серьезно улучшили работу с текстом на азиатских языках: в японском, корейском и китайском — везде есть явные улучшения.

Тестовая статья, распространявшаяся несколько дней назад в китайских технологических сообществах, также подтвердила эту новость. Несколько авторов с Zhihu тогда провели практические сравнения GPT-Image-2 и конкурирующего продукта Google Nano Banana Pro, включая различные сценарии: дизайн китайских постеров, обложки для e-commerce, интерфейсы соцсетей и оцифрованные диаграммы.

Тест статьи Zhihu: GPT-Image 2.0

Результаты тестов показывают, что GPT-Image-2 заметно превосходит в эстетике шрифтов для китайских иероглифов, иерархии верстки и общем ощущении дизайна. Сгенерированные постеры по стилю ближе к реальным коммерческим материалам, а не к шаблонным выводам с явным «AI-ощущением». В статье также указано, что GPT-Image-2 демонстрирует более высокую точность деталей и при воссоздании интерфейсов — например, (как кадры из игр или скриншоты из мессенджеров) — а также в восстановлении сцен с реальными портретами.

ChatGPT Images 2.0 полностью открыта, API также запущен

На данный момент ChatGPT Images 2.0 с этого вторника уже бесплатно доступна для всех пользователей ChatGPT и Codex, а платные пользователи могут разблокировать более продвинутые эффекты вывода. Параллельно OpenAI также открыла GPT-Image-2 API. Цена рассчитывается по уровням качества вывода и разрешения, предоставляя компаниям и разработчикам гибкость для интеграции.

Важно отметить, что у новой модели дата окончания знаний — декабрь 2025 года. Для подсказок по генерации изображений, связанных с самыми свежими событиями, точность может быть ограничена. Кроме того, скорость генерации сложных композиций также не может быть такой же мгновенной, как у обычных текстовых вопросов и ответов, но все равно занимает всего несколько минут.

Эта статья: ChatGPT Images 2.0 выходит в свет! Существенно повышена точность генерации текста, легко создавать маркетинговые постеры — впервые появилась в Цепных новостях ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Google: 75% нового кода в Google генерируется ИИ

Новости индустрии ИИ

Google сообщает, что 75% нового кода, создаваемого с помощью ИИ, и что более половины инвестиций в вычисления для машинного обучения нацелены на операции облачного бизнеса. Аннотация: В корпоративном обновлении Google заявляет, что ИИ теперь генерирует около 75% нового кода, а основная часть инвестиций компании в вычисления для машинного обучения будет направлена на облачные бизнес-операции.

GateNews39м назад

Google Cloud запускает чипы TPU8T и TPU8I для приложений искусственного интеллекта

Новости индустрии ИИ

Сообщение Gate News, 22 апреля — Google Cloud запустила новые чипы TPU8T и TPU8I, предназначенные для приложений искусственного интеллекта.

GateNews47м назад

Kimi K2.6 登顶 OpenRouter 编程基准，超越 Claude 与 GPT 系列

Новости индустрии ИИ

Kimi K2.6 登顶 OpenRouter 榜单，超越 Claude、GPT 以及开源竞争对手，表明本土 AI 取得进展，并缩小与全球领先者的差距。摘要：Kimi.ai 宣布其最新模型 Kimi K2.6 在 OpenRouter 编程能力榜单中排名第一，领先开发者评测。基准测试显示，K2.6 相比 Claude、GPT 系列以及其他开源模型，在各类编程任务上都表现出更优的性能，凸显其在代码生成和开发任务处理方面的提升，并传递出本土 AI 向国际领先水平迈进的信号。

GateNews54м назад

Robinhood Ventures Fund Инвестирует $75M в OpenAI: Розничные инвесторы получают доступ к ИИ-гиганту

Акции Новости индустрии ИИ

Robinhood Ventures Fund I инвестирует $75M в OpenAI, чтобы предоставить розничным инвесторам прямой доступ к долевому участию, добавив Databricks, Revolut и Oura; напряженность с OpenAI, похоже, улажена. Аннотация: В статье сообщается, что частное инвестиционное юрлицо Robinhood, Robinhood Ventures Fund I, обязалось $75 миллионов инвестировать в OpenAI, чтобы предоставить розничным инвесторам прямые доли в капитале ведущей AI-компании, одновременно формируя портфель, включающий Databricks, Revolut и Oura. Этот шаг расширяет доступ к частным технологическим долевым инвестициям и нацелен на экспозицию ключевых игроков в сфере ИИ, таких как OpenAI, Anthropic и xAI, сигнализируя о пути к более активному участию розничных инвесторов в высокорослых AI-инвестициях. Похоже, партнерство разрешает прежние противоречия между Robinhood и OpenAI из-за планов по токенизированному долевому участию в Европе.

GateNews58м назад

На создателей AI16Z и ELIZAOS подали в суд по обвинениям в мошенничестве на $2,6 млрд; падение токена на 99,9% от пика

Меры по обеспечению соблюдения Инциденты с безопасностью Новости индустрии ИИ Токены ИИ

Федеральный коллективный иск обвиняет AI16Z/ELIZAOS в криптомошенничестве на $2,6 млрд через фальшивые заявления об ИИ и обманный маркетинг, утверждая покровительство инсайдеров и инсценированную автономную систему; требует возмещения ущерба в соответствии с законами о защите прав потребителей. Аннотация: В этом отчете описан поданный 21 апреля в SDNY федеральный коллективный иск, в котором обвиняются AI16Z и его переименование ELIZAOS в криптомошенничестве на $2,6 млрд с использованием фальшивых заявлений об ИИ и обманного маркетинга. В иске утверждается о созданной связке с Andreessen Horowitz и о неавтономной системе. Приводятся данные о пиковой оценке в начале 2025 года, об обвале на 99,9% и примерно о 4 000 убыточных кошельков; при этом инсайдеры получили ~40% новых токенов. Истцы просят возмещения ущерба и справедливой помощи (equitable relief) в соответствии с законами штатов Нью-Йорк и Калифорния о защите потребителей. Регуляторы в Корее и крупные биржи предупреждали или приостанавливали связанную торговлю.

GateNews1ч назад

Tencent и Alibaba обсуждают инвестиции в DeepSeek, оценка превышает $200 миллиардов

Новости индустрии ИИ

Сообщение Gate News, 22 апреля — Tencent и Alibaba ведут переговоры о вложениях в DeepSeek, сообщило The Information. Оценка DeepSeek превышает $200 миллиардов.

GateNews1ч назад

комментарий

0/400

Нет комментариев