STIVA

Sakana Fugu: один API, который рулит всеми ИИ-моделями. Разбираемся, как это работает

Японский стартап Sakana AI выпустил систему, которая динамически выбирает лучшую модель для каждой задачи

0 просмотров~3 мин чтения
Абстрактная визуализация мультиагентной ИИ-системы: центральное ядро-оркестратор соединено неоновыми потоками данных с множеством нейронных узлов, киберпанк-эстетика в фиолетово-голубых тонах
Абстрактная визуализация мультиагентной ИИ-системы: центральное ядро-оркестратор соединено неоновыми потоками данных с множеством нейронных узлов, киберпанк-эстетика в фиолетово-голубых тонах

Выбирать не надо — пусть система сама решает

Пока вся индустрия зациклилась на сравнении отдельных моделей — кто сильнее в кодинге, кто лучше рассуждает, — японский стартап Sakana AI пошёл другим путём. Они выпустили Fugu Ultra: систему, которая не является моделью в привычном смысле. Это оркестратор, который динамически собирает команду из нескольких ИИ-моделей и координирует их работу через единый API.

Идея простая и одновременно гениальная: нет идеальной модели для всех задач. Зато можно научить систему понимать, какая модель справится с конкретной подзадачей лучше, и делегировать ей работу. Fagu Ultra делает это автоматически — пользователь видит один API, а внутри кипит мультиагентная работа.

Что под капотом

За Fugu стоят две серьёзные научные работы, опубликованные на ICLR 2026:

  • TRINITY — эволюционный координатор, который распределяет роли между моделями: «Thinker» (думает), «Worker» (код пишет), «Verifier» (проверяет). Лёгкий, быстрый, работает за несколько итераций.
  • Conductor — координатор, обученный через reinforcement learning. Он самостоятельно находит стратегии коммуникации между агентами на естественном языке, создавая паттерны взаимодействия, которые эффективнее любой ручной архитектуры.

Вместо того чтобы проектировать мультиагентную систему вручную (кто с кем общается, в каком порядке), Fugu сам учится оптимальным способам координации. Это как разница между написанным вручную пайплайном и системой, которая сама нашла лучшую конфигурацию через обучение.

Результаты на бенчмарках — впечатляют

Sakana выложила сравнение с Opus 4.8, Gemini 3.1 Pro и GPT 5.5. На нескольких ключевых бенчмарках Fugu Ultra показала лучшие результаты:

  • SWE-Bench Pro — 73,7% (против 69,2% у Opus 4.8)
  • LiveCodeBench — 93,2% (против 88,5% у Gemini 3.1 Pro)
  • TerminalBench 2.1 — 82,1% (против 78,2% у GPT 5.5)
  • Humanity's Last Exam — 50,0% (против 49,8% у Opus 4.8)

Но особенно интересны качественные примеры. Fugu Ultra писала работающий солвер для кубика Рубика на чистом Python (300 из 300 решены), обыграла Stockfish 2100-ELO в слепые шахматы, самостоятельно провела ML-эксперимент из 123 запусков и выиграла у базовых моделей по качеству результата. Это не просто цифры на бумаге — это реально работающая система.

Почему это важно для России

В контексте экспортных ограничений, которые всё сильнее затрагивают ИИ-индустрию, подход Sakana выглядит особенно привлекательным. Fugu не привязан к одному вендору и не подпадает под экспортные правила так же, как отдельные фронтальные модели. Плюс — возможность исключать конкретные провайдеры из пула агентов (для compliance и приватности).

Цены вполне адекватные: $5 за миллион входных токенов (~450 ₽), $30 за выходные (~2 700 ₽) в базовом режиме, $10/$45 для контекстов свыше 272K токенов. Для сравнения — это ближе к mid-tier моделям, но с производительностью топ-уровня.

Моё мнение

Сакана сделала то, о чём многие говорят, но мало кто реализует: вместо гонки «чья модель больше» они пошли по пути интеллектуальной координации. Это как перейти от одного гениального солиста к слаженному оркестру — где дирижёр тоже ИИ.

Есть, конечно, вопросы: насколько система прозрачна в выборе моделей, что happens when one provider goes down, и как быстро обновляется пул агентов. Но направление — правильное. Если вы работаете с ИИ на production-уровне, Fugu стоит присмотреть.

Вывод

Sakana Fugu Ultra — это не очередная «ещё одна ИИ-модель». Это новый подход к тому, как мы используем искусственный интеллект: не как монолит, а как экосистему. Пока OpenAI, Anthropic и Google соревнуются в размерах своих моделей, кто-то quietly строит систему, которая извлекает максимум из всех сразу. И это, возможно, будущее всей индустрии.

Читайте также