Одна модель, чтобы управлять всеми
Японский стартап Sakana AI анонсировал Sakana Fugu и Sakana Fugu Ultra — системы, которые работают совершенно иначе, чем привычные одиночные ИИ-модели. Вместо попытки натренировать одну «супермодель», Fugu динамически подбирает и комбинирует несколько фронтальных моделей — Gemini 3.1 Pro, Opus 4.8, GPT 5.5 — в зависимости от задачи, маршрутизируя запросы через единственный OpenAI-совместимый API.
Как это работает: TRINITY и Conductor
За Fugu стоят две научные работы, опубликованные на ICLR 2026 — TRINITY и Conductor. TRINITY использует лёгкого эволюционного координатора, который распределяет роли между моделями: Thinker (мыслитель), Worker (исполнитель) и Verifier (проверяющий). Conductor идёт дальше — с помощью reinforcement learning система сама находит оптимальные стратегии координации и проектирует коммуникационные паттерны между агентами.
Иными словами, Fugu не просто вызывает разные модели — она учится решать, какая модель для какого подзадачи подходит лучше, как их комбинировать и когда переключаться.
Результаты: коллективный интеллект побеждает одиночек
- SWE Bench Pro: Fugu Ultra — 73.7% (GPT 5.5 — 58.6%, Opus 4.8 — 69.2%)
- TerminalBench 2.1: Fugu Ultra — 82.1% (ближайший соперник — 78.2%)
- LiveCodeBench: Fugu Ultra — 93.2% (Opus 4.8 — 87.8%)
- Humanity Last Exam: Fugu Ultra — 50.0% (Opus 4.8, 49.8%, Gemini 3.1 Pro — 44.4%)
- GPQA-D: Fugu и Fugu Ultra — 95.5%
Пять качественных тестов — от кубика Рубика до шахмат
Sakana провела серию впечатляющих демонстраций. В задаче написания солювера для кубика Рубика с нуля на чистом Python, Fugu Ultra обошёл ближайшую модель по числу ходов (в среднем 19.72 против 19.76), а две другие модели просто не смогли выполнить задачу — их падающий код не решил ни одного из 300 кубиков.
В задаче восстановления порядка чтения древних японских текстов (假名消息, 1610 год) Fugu Ultra набрал 0.80 по метрике NED, тогда как лучшие отдельные модели — лишь 0.24. В четырёх партиях «слепого шахмата» подряд Fugu обыграл четырёх сильных соперников, включая Stockfish с Elo 2100.
Отдельно стоит отметить эксперимент с AI-исследователем: Fugu Ultra провёл 123 эксперимента за 14 часов на одном H100 GPU, автономно оптимизируя рецептуру обучения нейросети, и достиг лучшего результата по bits-per-byte среди всех протестированных моделей.
Главный козырь: иммунитет к экспортным ограничениям
Самое важное — Fugu работает только с публично доступными моделями. После недавних шагов администрации США, которые заблокировали доступ к Claude Fable 5 и Mythos 5 для международных пользователей, это становится стратегическим преимуществом. Никаких экспортных ограничений, никаких блокировок.
Sakana также позволяет исключать конкретных провайдеров из пула агентов — критически для организаций с требованиями к комплаенсу и конфиденциальности данных.
Мнение редакции
Две вещи в этой новости цепляют. Первая — подход «оркестрации вместо гонки за одной моделью» выглядит как более устойчивый путь развития ИИ. Вместо того чтобы вкладывать миллиарды в тренировку следующей модели, Fugu использует то, что уже есть, но умнее. Вторая — обход экспортных ограничений без нарушения закона. Это не обходной путь серой зоны — это принципиально другой подход к архитектуре, который делает границы между юрисдикциями менее значимыми.
Доступность такой системы в России через stiva.ai — вопрос времени. Если Sakana откроет API для международных пользователей, Fugu может стать одним из ключевых инструментов для разработчиков, которым нужен максимум мощности без привязки к одному вендору.





