Одна модель, чтобы управлять всеми
Пока ИИ-индустрия соревнуется в гонке за самую мощную модель, японский стартап Sakana AI решил, что настоящий прорыв — не в том, чтобы сделать ещё одну модель, а в том, чтобы правильно объединить уже существующие. И результаты, мягко говоря, впечатляют.
Как это работает
Sakana Fugu и Fugu Ultra — это мультиагентная система, доступная через один OpenAI-совместимый API. Вместо того чтобы полагаться на одну модель, система динамически выбирает и переключает между пулом фронтирных моделей — Claude Opus 4.8, Gemini 3.1 Pro, GPT 5.5 — для каждой подзадачи.
Ключевое отличие: алгоритм не следует заранее заданной схеме. Он учится создавать неочевидные, но эффективные паттерны взаимодействия между моделями. За этим стоят две научные статьи, опубликованные на ICLR 2026:
- TRINITY — используется лёгкий эволюционный координатор, который распределяет роли между LLM: Thinker (мыслитель), Worker (исполнитель), Verifier (проверяющий).
- Conductor — обученный через reinforcement learning дирижёр, который обнаруживает стратегии координации на естественном языке и проектирует схемы общения между агентами.
Результаты бенчмарков
Цифры говорят сами за себя:
- SWE Bench Pro: Fugu Ultra — 73.7, Opus 4.8 — 69.2, GPT 5.5 — 58.6
- LiveCodeBench: Fugu Ultra — 93.2, Opus 4.8 — 87.8, GPT 5.5 — 85.3
- Humanity's Last Exam: Fugu Ultra — 50.0, Opus 4.8 — 49.8, Gemini 3.1 Pro — 44.4
- GPQA-D: Fugu Ultra — 95.5, все базовые модели — 92–94.3
Система не просто дотягивается до фронтирных моделей — она их превосходит по большинству метрик, особенно на сложных инженерных и научных задачах.
Почему это важно — особенно сейчас
Sakana прямо указывает: Fugu обеспечивает frontier-уровень производительности без риска экспортных ограничений. После того как администрация США заблокировала модели Anthropic для публичного доступа, проблема vendor lock-in стала не теоретической, а вполне конкретной.
Идея проста: если ваша система зависит от одной модели — вы в зоне риска. Если используете пул — переключение незаметно для пользователя. Это как раз то, что нужно бизнесу, который строит продукты на ИИ.
Мнение редактора
Sakana Fugu — это, возможно, первый реальный шаг к модели, где «лучшая модель» сама по себе перестанет быть важным вопросом. Вместо «какой ИИ лучше» мы получим «какой оркестратор лучше». И это меняет правила игры.
В России доступ к топовым ИИ-моделям — отдельная головная боль. Идея агрегатора, который скрывает за одним API десятки моделей, выглядит как будущее, которое уже началось. Именно поэтому мы строим STIVA.ai — чтобы у вас был доступ ко всему этому без VPN и зарубежных карт.
Ограничения
Система пока недоступна в Евросоюзе и ЕЭЗ из-за GDPR. Два тарифа — Fugu (баланс скорости и качества) и Fugu Ultra (максимальная производительность для сложных задач like Kaggle, научные публикации, кибербезопасность). Конкретные цены не раскрываются.





