OpenAI сегодня (18-го числа) официально выпустила две новые легкие модели — GPT-5.4 Mini и GPT-5.4 Nano. Первая из них в два раза быстрее предыдущей версии, при этом цена составляет всего 0,75 долларов за миллион входных токенов, в то время как вторая модель ориентирована на сверхнизкую задержку и конкурирует на рынке с высокой пропускной способностью, предлагая цену всего 0,20 долларов за миллион токенов.
(Предыстория: OpenAI выпустила GPT-5.2! Стремление заменить профессионалов, снижение галлюцинаций, обзор цен на API)
(Дополнительный фон: Полный обзор презентации GPT-5 от OpenAI: бесплатный доступ, ключевые функции, цены на API GPT-5, GPT-5 Mini и GPT-5 Nano)
Содержание статьи
Переключить
Сегодня (18-го числа) в полночь OpenAI одновременно выпустила две небольшие языковые модели — GPT-5.4 Mini и GPT-5.4 Nano. Эти модели не являются флагманскими, а предназначены явно как исполнительный слой в гибридной системе ИИ: более мощные флагманские модели управляют планированием, а множество мелких моделей параллельно выполняют повседневные вычислительные задачи.
OpenAI называет эту архитектуру «значительным повышением скорости и эффективности затрат за счет частичной точности», и этот компромисс — яркое отражение текущего тренда в индустрии ИИ, когда переходит от единой крупной модели к «многим агентам в сотрудничестве».
GPT-5.4 Mini — основной продукт этого релиза, ориентированный на баланс скорости и многозадачности. По сравнению с предыдущей версией, его скорость вывода увеличилась вдвое, а в ключевых областях — генерации кода, мультимодального понимания и вызовах инструментов — произошли существенные улучшения.
В бенчмарках GPT-5.4 Mini достигает 54,4% в SWE-Bench Pro (автоматическая исправление ошибок GitHub issue), а в OSWorld-Verified (автоматизация настольных операций) — 72,1%. Эти показатели демонстрируют лидерство среди моделей аналогичного уровня.
В функциональном плане модель поддерживает смешанный ввод текста и изображений, вызовы инструментов, поиск в сети и файлах, а также взаимодействие с пользовательским интерфейсом компьютера — практически все современные потребности AI-приложений. Основные сценарии использования, указанные официально OpenAI, включают: помощник по программированию, интеграцию с IDE, ревью кода, интерпретацию скриншотов, субагентов для работы с компьютером и системы с мгновенной обратной связью.
Ценообразование: входной поток — 0,75 долларов за миллион токенов, выход — 4,50 долларов, что продолжает стратегию OpenAI по снижению стоимости.
Доступность: GPT-5.4 Mini с сегодняшнего дня доступна в ChatGPT (бесплатный и платный уровни), Codex и через API OpenAI, а также может быть развернута через Azure AI Foundry.
GPT-5.4 Nano — более целенаправленная модель: OpenAI называет её «самой миниатюрной и наиболее экономичной моделью на сегодняшний день», специально созданной для сценариев, где критична задержка и требуется масштабная параллельная обработка.
В бенчмарках Nano показывает 52,4% в SWE-Bench Pro и 39,0% в OSWorld, немного уступая Mini, однако при очень низкой цене соотношение цена-качество выглядит очень выгодным.
В функциональном плане Nano поддерживает следование инструкциям, вызовы функций, базовый код, понимание изображений, классификацию и извлечение данных. Она подходит для большинства структурированных задач, но не предназначена для сложных настольных операций или глубокого логического вывода.
Ценообразование: всего 0,20 долларов за миллион входных токенов и 1,25 долларов за выход — примерно в четыре раза дешевле Mini, что делает её привлекательной для компаний с большим количеством автоматизированных вызовов. Официально заявленные сценарии включают: классификацию и извлечение данных, поддержку субагентов для кода, автоматизацию высокого уровня, маршрутизацию запросов, обработку форм и рабочие процессы поддержки клиентов.
Важно отметить, что GPT-5.4 Nano в настоящее время доступна только через API и не появится в интерфейсе ChatGPT, она явно ориентирована на разработчиков и корпоративных клиентов.
Рекламный слоган OpenAI для этих моделей — «созданы для эпохи субагентов», и за этим стоит конкретная продуктовая логика.
В многоагентных системах высший уровень — флагманские модели (например, GPT-5 или модели серии o) — отвечают за стратегическое планирование и сложные решения, а многочисленные повторяющиеся, структурированные задачи: парсинг веб-страниц, преобразование данных, заполнение форм, генерация фрагментов кода — могут выполняться параллельно более мелкими, быстрыми и дешевыми моделями. GPT-5.4 Mini и Nano специально созданы для этой исполнительной роли.
Эта концепция также объясняет, почему обе модели делают акцент на вызовах инструментов и взаимодействии с компьютером: в автоматизированных AI-архитектурах, где всё больше задач автоматизировано, небольшие модели, способные стабильно выполнять команды и взаимодействовать с внешними системами, ценны не меньше, чем более крупные флагманские модели с большим числом параметров.