STIVA

Sakana Fugu Ultra — «лучшая модель», которая просто перенаправляет запросы к другим

Sakana AI выпустила модель, которая выдаёт frontier-результаты, скрывая от пользователя, какая модель реально отвечает.

0 просмотров~2 мин чтения
Схема мультиагентной системы Sakana Fugu: неоновые связи между узлами моделей на тёмно-фиолетовом фоне
Схема мультиагентной системы Sakana Fugu: неоновые связи между узлами моделей на тёмно-фиолетовом фоне

Sakana Fugu Ultra: модель, которая не модель

22 июня японская компания Sakana AI представила Fugu Ultra — систему, которая по ряду бенчмарков превзошла Claude Opus 4.8, GPT 5.5 и Gemini 3.1 Pro. Звучит впечатляюще, но дьявол, как всегда, в деталях.

Как это работает на самом деле

Fugu Ultra — не самостоятельная языковая модель. Это мультиагентная система, которая динамически выбирает, к какому из внешних API-моделей направить запрос. Она использует два алгоритма маршрутизации — TRINITY и Conductor — оба опубликованные на ICLR 2026. TRINITY распределяет роли между моделями (Thinker — «подумать», Worker — «сделать», Verifier — «проверить»), а Conductor учится оптимальным паттернам коммуникации между агентами через reinforcement learning.

При этом Sakana не раскрывает, какая именно модель использовалась для конкретного запроса. Пользователь отправляет один запрос в один API — а что происходит внутри, остаётся за кадром.

Результаты на бенчмарках

  • SWE Bench Pro: Fugu Ultra — 73.7, Opus 4.8 — 69.2, GPT 5.5 — 58.6
  • LiveCodeBench: Fugu Ultra — 93.2, Opus 4.8 — 87.8, GPT 5.5 — 85.3
  • TerminalBench 2.1: Fugu Ultra — 82.1, GPT 5.5 — 78.2, Opus 4.8 — 74.6
  • Humanity's Last Exam: Fugu Ultra — 50.0, Opus 4.8 — 49.8, GPT 5.5 — 41.4

В большинстве бенчмарков Fugu Ultra действительно лидирует. Но если честно — это не значит, что Sakana создала «лучшую модель». Это значит, что она создала лучшую систему маршрутизации. И это, пожалуй, не менее важно.

Зачем это нужно

Ключевое преимущество — отсутствие зависимости от одного вендора. Если Anthropic подпадет под экспортные ограничения (привет, история с Claude Mythos 5), Fugu спокойно переключится на другие модели. Это особенно актуально в 2026 году, когда экспортные ограничения на ИИ-модели становятся реальностью.

Система также доступна через один OpenAI-совместимый API — то есть интеграция тривиальна для большинства разработчиков.

Мнение редакции

Sakana Fugu — это, по сути, признание: ни одна отдельная модель не будет лучшей во всём. Правильнее orchestrировать множество моделей, чем пытаться обучить одну «универсальную». Эта философия нам близка — вся логика STIVA построена на том же принципе: дать пользователю выбор из лучших моделей, а не заставлять выбирать один инструмент.

Правда, остаётся вопрос прозрачности. Когда вы не знаете, какая модель обрабатывает ваши данные, возникают вопросы к приватности, compliance и предсказуемости ответов. Sakana позволяет исключить конкретные модели из пула — но это костыль, а не решение.

Вывод

Sakana Fugu Ultra — не революция, но важный сигнал. Будущее ИИ — не в одной супермодели, а в грамотной координации множества моделей. И компании, которые научатся это делать хорошо (и прозрачно), получат серьёзное преимущество на рынке.

Читайте также