STIVA

Одна модель, чтобы управлять всеми: Sakana Fugu Ultra и конец монокультуры ИИ

Sakana AI выпустила оркестратор, который объединяет лучшие модели в систему, превосходящую каждую из них.

0 просмотров~3 мин чтения
Центральный ИИ-координатор в виде светящейся сферы, соединённый неоновыми потоками данных с несколькими периферийными моделями — абстрактная визуализация мультиагентной оркестрации
Центральный ИИ-координатор в виде светящейся сферы, соединённый неоновыми потоками данных с несколькими периферийными моделями — абстрактная визуализация мультиагентной оркестрации

Что такое Sakana Fugu Ultra?

Японско-европейская компания Sakana AI выпустила систему под названием Fugu Ultra — и это, честно говоря, одна из самых интересных новостей в ИИ за последние недели. Вместо того чтобы тренировать ещё одну гигантскую модель на ещё больших данных, Sakana пошла принципиально другим путём.

Fugu — это не модель-нейронка в классическом понимании. Это оркестратор мультиагентных систем. Он подключается к нескольким фронтирным моделям (Gemini, Claude, GPT и другие) и для каждого шага задачи решает, кого вызвать, в каком порядке и с какой инструкцией. Вся координация — через единый OpenAI-совместимый API. Один вызов — внутри него может сработать целая цепочка агентов.

Как это устроено под капотом

Sakana опирается на две научные работы, опубликованные на ICLR 2026 — TRINITY и Conductor. Первая обучает лёгкого «координатора» распределять роли между моделями: «мыслитель», «исполнитель», «проверяющий». Вторая идёт глубже — координатор обучается через reinforcement learning и сам находит оптимальные коммуникационные паттерны между агентами.

Важный момент: Fugu не просто последовательно вызывает модели в заранее заданном порядке. Система динамически собирает команду под конкретную задачу, и пользователи могут исключать определённые провайдеры из пула — для соблюдения комплаенса, приватности или внутренних политик компании.

Цифры, которые заставляют задуматься

Бенчмарки выглядят впечатляюще. Вот основные результаты Fugu Ultra в сравнении с ведущими одиночными моделями:

  • SWE-Bench Pro (инженерные задачи): 73.7 — значительно выше Opus 4.8 (69.2) и GPT 5.5 (58.6)
  • LiveCodeBench (кодинг с нуля): 93.2 против лучшего GPT 5.5 на 87.8
  • SciCode (научный кодинг): 58.7 против 58.9 у лучшего оппонента — практически на уровне
  • GPQA-D (PhD-уровень научные вопросы): 95.5 — лучший результат среди всех
  • Humanity's Last Exam (сверхсложные вопросы): 50.0 против лучшего 49.8

Качественные примеры — где оркестрация показывает зубы

Кроме сухих цифр, есть показательные кейсы, где разница между оркестратором и одиночной моделью видна невооружённым глазом. Задача с рубик-куб-солвером на чистом Python: Fugu написал рабочий решатель, с решающий все 300 скрэмблов в среднем за 19.72 хода. Один из оппонентов сделал рабочий код (21 ход), два других вообще не справились — код падал при исполнении.

Механический айрис в CAD — камера «диафрагма» с подвижными лепестками. Fugu спроектировал рабочую механику: лепестки вращаются на внешних осях и корректно открывают/закрывают отверстие. У других моделей — щели, слабые связи, неполное закрытие.

Ещё более впечатляет, что на задачах автоисследования ML (автоматическое улучшение обучения модели) Fugu провёл 123 эксперимента за 14 часов на одном GPU и выдал лучший результат — BPB 0.9748. Это тот случай, где агентная система не просто «собирает ответы», а действительно исследует.

Почему это важно — личное мнение

Мне кажется, что Fugu — это ранний сигнал важного сдвига. Всю генерацию ИИ мы жили в парадигме «одна модель — один ответ». И соревнование сводилось к тому, у кого эта модель больше, умнее и дороже. Но Sakana предлагает другую оптику: не наращивай один мозг, организуй команду.

Это перекликается с тем, как работают лучшие инженеры-люди. Никто не ожидает, что один человек будет одинаково хорош в ML-исследовании, веб-безопасности, математике и CAD-дизайне. Но команда специалистов — да. Fugu по сути создаёт такую команду из разных моделей, каждая из которых может быть сильнее на своём участке.

Есть и критический аспект: Fugu избегает экспортного регулирования. Поскольку сам не обучает модель, а лишь координирует публичные модели, он не попадает под те же ограничения, что и Anthropic или OpenAI. Для пользователей из стран, подверженных санкциям, это потенциально очень важный момент.

Цены и доступность

Тарификация у Fugu довольно прозрачная. В режиме токенов для Fugu Ultra: $5 за миллион входных токенов, $30 за миллион выходных (примерно 450 ₽ и 2 700 ₽ при текущем курсе $90). При контексте более 272K токенов цены удваиваются.

Есть подписка с безлимитными генерациями, а также режим, когда при активации только одного агента клиент платит только за этот конкретную модель по её стандартной ставке — Sakana не берёт наценку за маршрутизацию.

Доступ сейчас через OpenRouter и Vercel AI Gateway. Пока недоступен в EU/EEA — компания работает над соответствием GDPR.

Вывод

Sakana Fugu Ultra — это не просто ещё один ИИ-сервис. Это архитектурная идея нового типа: мультиагентная система как продукт, доставляемая через один API. Если подход сработает, мы можем увидеть отход от модели «одна компания — одна модель» к модели «одна платформа — десятки моделей, оптимально организованных». Пока рано говорить, что это меняет правила игры. Но первый звонок прозвучал, и он довольно громкий.

Читайте также