Sakana Fugu Ultra: ИИ-оркестратор без экспортных ограничений

Одна модель, чтобы управлять всеми

Японский стартап Sakana AI анонсировал Sakana Fugu и Sakana Fugu Ultra — системы, которые работают совершенно иначе, чем привычные одиночные ИИ-модели. Вместо попытки натренировать одну «супермодель», Fugu динамически подбирает и комбинирует несколько фронтальных моделей — Gemini 3.1 Pro, Opus 4.8, GPT 5.5 — в зависимости от задачи, маршрутизируя запросы через единственный OpenAI-совместимый API.

Как это работает: TRINITY и Conductor

За Fugu стоят две научные работы, опубликованные на ICLR 2026 — TRINITY и Conductor. TRINITY использует лёгкого эволюционного координатора, который распределяет роли между моделями: Thinker (мыслитель), Worker (исполнитель) и Verifier (проверяющий). Conductor идёт дальше — с помощью reinforcement learning система сама находит оптимальные стратегии координации и проектирует коммуникационные паттерны между агентами.

Иными словами, Fugu не просто вызывает разные модели — она учится решать, какая модель для какого подзадачи подходит лучше, как их комбинировать и когда переключаться.

Результаты: коллективный интеллект побеждает одиночек

SWE Bench Pro: Fugu Ultra — 73.7% (GPT 5.5 — 58.6%, Opus 4.8 — 69.2%)
TerminalBench 2.1: Fugu Ultra — 82.1% (ближайший соперник — 78.2%)
LiveCodeBench: Fugu Ultra — 93.2% (Opus 4.8 — 87.8%)
Humanity Last Exam: Fugu Ultra — 50.0% (Opus 4.8, 49.8%, Gemini 3.1 Pro — 44.4%)
GPQA-D: Fugu и Fugu Ultra — 95.5%

Пять качественных тестов — от кубика Рубика до шахмат

Sakana провела серию впечатляющих демонстраций. В задаче написания солювера для кубика Рубика с нуля на чистом Python, Fugu Ultra обошёл ближайшую модель по числу ходов (в среднем 19.72 против 19.76), а две другие модели просто не смогли выполнить задачу — их падающий код не решил ни одного из 300 кубиков.

В задаче восстановления порядка чтения древних японских текстов (假名消息, 1610 год) Fugu Ultra набрал 0.80 по метрике NED, тогда как лучшие отдельные модели — лишь 0.24. В четырёх партиях «слепого шахмата» подряд Fugu обыграл четырёх сильных соперников, включая Stockfish с Elo 2100.

Отдельно стоит отметить эксперимент с AI-исследователем: Fugu Ultra провёл 123 эксперимента за 14 часов на одном H100 GPU, автономно оптимизируя рецептуру обучения нейросети, и достиг лучшего результата по bits-per-byte среди всех протестированных моделей.

Главный козырь: иммунитет к экспортным ограничениям

Самое важное — Fugu работает только с публично доступными моделями. После недавних шагов администрации США, которые заблокировали доступ к Claude Fable 5 и Mythos 5 для международных пользователей, это становится стратегическим преимуществом. Никаких экспортных ограничений, никаких блокировок.

Sakana также позволяет исключать конкретных провайдеров из пула агентов — критически для организаций с требованиями к комплаенсу и конфиденциальности данных.

Мнение редакции

Две вещи в этой новости цепляют. Первая — подход «оркестрации вместо гонки за одной моделью» выглядит как более устойчивый путь развития ИИ. Вместо того чтобы вкладывать миллиарды в тренировку следующей модели, Fugu использует то, что уже есть, но умнее. Вторая — обход экспортных ограничений без нарушения закона. Это не обходной путь серой зоны — это принципиально другой подход к архитектуре, который делает границы между юрисдикциями менее значимыми.

Доступность такой системы в России через stiva.ai — вопрос времени. Если Sakana откроет API для международных пользователей, Fugu может стать одним из ключевых инструментов для разработчиков, которым нужен максимум мощности без привязки к одному вендору.

Sakana Fugu: ИИ-система, управляющая другими моделями

Одна модель, чтобы управлять всеми

Как это работает: TRINITY и Conductor

Результаты: коллективный интеллект побеждает одиночек

Пять качественных тестов — от кубика Рубика до шахмат

Главный козырь: иммунитет к экспортным ограничениям

Мнение редакции

Об авторе

Нова

Читайте также

Sakana AI представила Fugu — систему, которая управляет несколькими ИИ-моделями через один API

Sakana AI выпустила систему, которая объединяет десятки ИИ-моделей в одну

Sakana Fugu: один API, который рулит всеми ИИ-моделями. Разбираемся, как это работает

Claude Tag от Anthropic: ИИ-коллега в Slack, который работает 24/7