OpenRouter запускає Fusion API: гібридне наближення трьох моделей Fable 5, вартість лише половина

OpenRouter 13 червня офіційно представив Fusion API, що дозволяє розробникам через один API викликати кілька моделей одночасно для паралельного розрахунку, а потім модель Judge об’єднує результати у найкращу відповідь. У глибокому тесті DRACO Fusion показав 69%, перевищуючи Claude Fable 5 з 65.3%, а низькобюджетна панель з Gemini 3 Flash, Kimi K2.6 і DeepSeek V4 Pro показала майже таку ж ефективність — лише на менше 1%, при цьому вартість становить лише половину.

(Передісторія: Google інвестував у AI-платформу OpenRouter, оцінка — 1,3 мільярди доларів, зростання на 240% за рік)

(Додатковий контекст: Аналіз 100 трильйонів токенів у звіті OpenRouter: що саме люди роблять з AI, зростання китайських моделей і секрети утримання користувачів)

Зміст статті

Перемикач

  • Глибокий тест DRACO: Fusion повністю перевершує окремі моделі
  • Бюджетна панель також може змагатися: об’єднання трьох моделей — лише на 1% гірше за Fable
  • Fusion — не заміна Fable, але чітко визначені сценарії застосування
  • Чотири способи виклику — один погляд

Популярна AI-платформа OpenRouter 13 червня офіційно запустила Fusion API. Ця нова функція дозволяє розробникам одночасно надсилати одне й те саме запитання кільком моделям, а модель Judge обробляє всі відповіді, створює структурований аналіз — включаючи точки згоди, розбіжності, часткове покриття, унікальні погляди та сліпі зони — і формує остаточну відповідь. Весь процес виконується на сервері, і досвід користувача ідентичний виклику однієї моделі.

Глибокий тест DRACO: Fusion повністю перевершує окремі моделі

Команда OpenRouter провела оцінку за допомогою глибокого тесту DRACO від Perplexity AI, що охоплює 100 складних дослідницьких завдань з 10 галузей. Оцінка базується на точності фактів (близько 20), широті та глибині (близько 9), якості презентації (близько 6) і якості цитувань (близько 5), із застосуванням зважених коефіцієнтів, щоб штрафувати моделі за неправильну інформацію.

Ось результати оцінки для кожної конфігурації:

  • Fusion (Fable 5 + GPT-5.5 → Об’єднання Opus 4.8): 69.0% 🥇
  • Fusion (Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro → Об’єднання Opus 4.8): 68.3%
  • Fusion (Opus 4.8 + GPT-5.5 → Об’єднання Opus 4.8): 67.6%
  • Fusion (Об’єднання Opus 4.8 з самим собою): 65.5%
  • Claude Fable 5 — окрема модель: 65.3% (завершено лише 93 з 100 завдань через блокування фільтрами)
  • Fusion (Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro → Об’єднання Opus 4.8): 64.7% 🔥
  • DeepSeek V4 Pro — окрема модель: 60.3%
  • GPT-5.5 — окрема модель: 60.0%
  • Claude Opus 4.8 — окрема модель: 58.8%

Бюджетна панель також може змагатися: об’єднання трьох моделей — лише на 1% гірше за Fable

Найвражаючий результат — у групі «бюджетних моделей»: Gemini 3 Flash, Kimi K2.6 і DeepSeek V4 Pro, що є дешевими моделями, у Fusion досягли 64.7%, обігнавши GPT-5.5 (60.0%) і Opus 4.8 (58.8%), і майже не поступилися Claude Fable 5 — менше ніж на 1%. Вартість при цьому — лише половина від останньої. Це означає, що розробники можуть отримати майже топову глибоку аналітику за меншими витратами.

Ще одне цікаве відкриття — «самооб’єднання» теж працює. Якщо об’єднати дві копії Opus 4.8 у панелі і дати їм об’єднатися через Opus 4.8 як Judge, результат — 65.5%, що на 6.7% вище за один Opus 4.8 (58.8%). Це свідчить, що значна частина переваги Fusion — у процесі синтезу, навіть одна й та сама модель, запущена двічі з різними шляхами розв’язання та інструментами, може дати суттєвий приріст.

Fusion — не заміна Fable, але сценарії застосування чітко визначені

Генеральний директор OpenRouter Алекс Атархол у X заявив, що Fusion здатен досягти «рівня розумності Fable за половину ціни». Однак команда визнає, що DRACO не враховує довготривалі завдання (long-horizon), у яких Claude Fable 5 справді сильна. Для складних завдань, що вимагають багатоетапного роздуму та довгого контексту, Fable ще довго залишатиметься незамінною.

Що стосується сценаріїв розробки, Fusion не замінює моделі для програмування. OpenRouter розробив його як серверний інструмент: коли базова модель стикається з питаннями, що потребують глибокого аналізу (архітектурні рішення, найкращі практики), система автоматично вирішує, чи викликати Fusion для отримання багатогранного аналізу, а щоденне програмування залишається на основній моделі.

Чотири способи виклику — один погляд

Розробники можуть використовувати Fusion чотирма способами:

  • Тест у чат-кімнаті: просто перейти на openrouter.ai/fusion, обрати пресет або створити власну панель
  • Model slug: у API вказати "model": "openrouter/fusion", автоматично підключаючи стандартну передову панель
  • Server tool: додати до масиву tools об’єкт {"type": "openrouter:fusion"}, щоб модель сама вирішувала, коли викликати
  • Плагін: у API додати параметр plugins для налаштування комбінації моделей у панелі

За замовчуванням, виклики через Fusion коштують приблизно вдвічі дешевше за Fable, але відповіді займають у 2-3 рази більше часу (через паралельний розрахунок і об’єднання). OpenRouter обіцяє покращувати продуктивність на основі відгуків користувачів.

Ця стаття взята з OpenRouter Blog, перекладена та опрацьована Динамікою трендів.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено