STIVA

Sakana AI выпустила систему, которая объединяет десятки ИИ-моделей в одну

Fugu Ultra — мультиагентная система, динамически координирующая Claude, Gemini и GPT через один API

0 просмотров~2 мин чтения
Визуализация мультиагентной системы Sakana Fugu — сеть взаимосвязанных светящихся узлов на тёмном фоне
Визуализация мультиагентной системы Sakana Fugu — сеть взаимосвязанных светящихся узлов на тёмном фоне

Одна модель, чтобы управлять всеми

Пока ИИ-индустрия соревнуется в гонке за самую мощную модель, японский стартап Sakana AI решил, что настоящий прорыв — не в том, чтобы сделать ещё одну модель, а в том, чтобы правильно объединить уже существующие. И результаты, мягко говоря, впечатляют.

Как это работает

Sakana Fugu и Fugu Ultra — это мультиагентная система, доступная через один OpenAI-совместимый API. Вместо того чтобы полагаться на одну модель, система динамически выбирает и переключает между пулом фронтирных моделей — Claude Opus 4.8, Gemini 3.1 Pro, GPT 5.5 — для каждой подзадачи.

Ключевое отличие: алгоритм не следует заранее заданной схеме. Он учится создавать неочевидные, но эффективные паттерны взаимодействия между моделями. За этим стоят две научные статьи, опубликованные на ICLR 2026:

  • TRINITY — используется лёгкий эволюционный координатор, который распределяет роли между LLM: Thinker (мыслитель), Worker (исполнитель), Verifier (проверяющий).
  • Conductor — обученный через reinforcement learning дирижёр, который обнаруживает стратегии координации на естественном языке и проектирует схемы общения между агентами.

Результаты бенчмарков

Цифры говорят сами за себя:

  • SWE Bench Pro: Fugu Ultra — 73.7, Opus 4.8 — 69.2, GPT 5.5 — 58.6
  • LiveCodeBench: Fugu Ultra — 93.2, Opus 4.8 — 87.8, GPT 5.5 — 85.3
  • Humanity's Last Exam: Fugu Ultra — 50.0, Opus 4.8 — 49.8, Gemini 3.1 Pro — 44.4
  • GPQA-D: Fugu Ultra — 95.5, все базовые модели — 92–94.3

Система не просто дотягивается до фронтирных моделей — она их превосходит по большинству метрик, особенно на сложных инженерных и научных задачах.

Почему это важно — особенно сейчас

Sakana прямо указывает: Fugu обеспечивает frontier-уровень производительности без риска экспортных ограничений. После того как администрация США заблокировала модели Anthropic для публичного доступа, проблема vendor lock-in стала не теоретической, а вполне конкретной.

Идея проста: если ваша система зависит от одной модели — вы в зоне риска. Если используете пул — переключение незаметно для пользователя. Это как раз то, что нужно бизнесу, который строит продукты на ИИ.

Мнение редактора

Sakana Fugu — это, возможно, первый реальный шаг к модели, где «лучшая модель» сама по себе перестанет быть важным вопросом. Вместо «какой ИИ лучше» мы получим «какой оркестратор лучше». И это меняет правила игры.

В России доступ к топовым ИИ-моделям — отдельная головная боль. Идея агрегатора, который скрывает за одним API десятки моделей, выглядит как будущее, которое уже началось. Именно поэтому мы строим STIVA.ai — чтобы у вас был доступ ко всему этому без VPN и зарубежных карт.

Ограничения

Система пока недоступна в Евросоюзе и ЕЭЗ из-за GDPR. Два тарифа — Fugu (баланс скорости и качества) и Fugu Ultra (максимальная производительность для сложных задач like Kaggle, научные публикации, кибербезопасность). Конкретные цены не раскрываются.

Читайте также