Что такое Sakana Fugu Ultra?
Японско-европейская компания Sakana AI выпустила систему под названием Fugu Ultra — и это, честно говоря, одна из самых интересных новостей в ИИ за последние недели. Вместо того чтобы тренировать ещё одну гигантскую модель на ещё больших данных, Sakana пошла принципиально другим путём.
Fugu — это не модель-нейронка в классическом понимании. Это оркестратор мультиагентных систем. Он подключается к нескольким фронтирным моделям (Gemini, Claude, GPT и другие) и для каждого шага задачи решает, кого вызвать, в каком порядке и с какой инструкцией. Вся координация — через единый OpenAI-совместимый API. Один вызов — внутри него может сработать целая цепочка агентов.
Как это устроено под капотом
Sakana опирается на две научные работы, опубликованные на ICLR 2026 — TRINITY и Conductor. Первая обучает лёгкого «координатора» распределять роли между моделями: «мыслитель», «исполнитель», «проверяющий». Вторая идёт глубже — координатор обучается через reinforcement learning и сам находит оптимальные коммуникационные паттерны между агентами.
Важный момент: Fugu не просто последовательно вызывает модели в заранее заданном порядке. Система динамически собирает команду под конкретную задачу, и пользователи могут исключать определённые провайдеры из пула — для соблюдения комплаенса, приватности или внутренних политик компании.
Цифры, которые заставляют задуматься
Бенчмарки выглядят впечатляюще. Вот основные результаты Fugu Ultra в сравнении с ведущими одиночными моделями:
- SWE-Bench Pro (инженерные задачи): 73.7 — значительно выше Opus 4.8 (69.2) и GPT 5.5 (58.6)
- LiveCodeBench (кодинг с нуля): 93.2 против лучшего GPT 5.5 на 87.8
- SciCode (научный кодинг): 58.7 против 58.9 у лучшего оппонента — практически на уровне
- GPQA-D (PhD-уровень научные вопросы): 95.5 — лучший результат среди всех
- Humanity's Last Exam (сверхсложные вопросы): 50.0 против лучшего 49.8
Качественные примеры — где оркестрация показывает зубы
Кроме сухих цифр, есть показательные кейсы, где разница между оркестратором и одиночной моделью видна невооружённым глазом. Задача с рубик-куб-солвером на чистом Python: Fugu написал рабочий решатель, с решающий все 300 скрэмблов в среднем за 19.72 хода. Один из оппонентов сделал рабочий код (21 ход), два других вообще не справились — код падал при исполнении.
Механический айрис в CAD — камера «диафрагма» с подвижными лепестками. Fugu спроектировал рабочую механику: лепестки вращаются на внешних осях и корректно открывают/закрывают отверстие. У других моделей — щели, слабые связи, неполное закрытие.
Ещё более впечатляет, что на задачах автоисследования ML (автоматическое улучшение обучения модели) Fugu провёл 123 эксперимента за 14 часов на одном GPU и выдал лучший результат — BPB 0.9748. Это тот случай, где агентная система не просто «собирает ответы», а действительно исследует.
Почему это важно — личное мнение
Мне кажется, что Fugu — это ранний сигнал важного сдвига. Всю генерацию ИИ мы жили в парадигме «одна модель — один ответ». И соревнование сводилось к тому, у кого эта модель больше, умнее и дороже. Но Sakana предлагает другую оптику: не наращивай один мозг, организуй команду.
Это перекликается с тем, как работают лучшие инженеры-люди. Никто не ожидает, что один человек будет одинаково хорош в ML-исследовании, веб-безопасности, математике и CAD-дизайне. Но команда специалистов — да. Fugu по сути создаёт такую команду из разных моделей, каждая из которых может быть сильнее на своём участке.
Есть и критический аспект: Fugu избегает экспортного регулирования. Поскольку сам не обучает модель, а лишь координирует публичные модели, он не попадает под те же ограничения, что и Anthropic или OpenAI. Для пользователей из стран, подверженных санкциям, это потенциально очень важный момент.
Цены и доступность
Тарификация у Fugu довольно прозрачная. В режиме токенов для Fugu Ultra: $5 за миллион входных токенов, $30 за миллион выходных (примерно 450 ₽ и 2 700 ₽ при текущем курсе $90). При контексте более 272K токенов цены удваиваются.
Есть подписка с безлимитными генерациями, а также режим, когда при активации только одного агента клиент платит только за этот конкретную модель по её стандартной ставке — Sakana не берёт наценку за маршрутизацию.
Доступ сейчас через OpenRouter и Vercel AI Gateway. Пока недоступен в EU/EEA — компания работает над соответствием GDPR.
Вывод
Sakana Fugu Ultra — это не просто ещё один ИИ-сервис. Это архитектурная идея нового типа: мультиагентная система как продукт, доставляемая через один API. Если подход сработает, мы можем увидеть отход от модели «одна компания — одна модель» к модели «одна платформа — десятки моделей, оптимально организованных». Пока рано говорить, что это меняет правила игры. Но первый звонок прозвучал, и он довольно громкий.





