STIVA

Sakana AI представила Fugu — систему, которая управляет несколькими ИИ-моделями через один API

Sakana AI выпустила Fugu — мультиагентную систему, которая сама выбирает и координирует лучшие модели для каждой задачи

0 просмотров~2 мин чтения
Визуализация мультиагентной системы Sakana Fugu — множество нейронных узлов, координируемых центральным процессом
Визуализация мультиагентной системы Sakana Fugu — множество нейронных узлов, координируемых центральным процессом

Один API, чтобы управлять всеми

Японский стартап Sakana AI представил систему, которая звучит как ответ на главный вопрос индустрии: «Зачем выбирать одну модель, если можно все?» Sakana Fugu — это мультиагентная система, доступная через единый API, которая сама решает, какие модели подключить для каждой конкретной задачи, и координирует их работу.

Вместо того чтобы заставлять разработчиков самостоятельно маршрутизировать запросы между разными провайдерами, Fugu обучается динамически собирать пул агентов и координировать их через неочевидные, но эффективные паттерны коллаборации. Пользователь делает один запрос — система делает остальное.

Два уровня: Fugu и Fugu Ultra

Система предлагается в двух вариантах:

  • Fugu — баланс между производительностью и скоростью ответа, подходит для повседневных задач: код-ревью, чат-боты, стандартное программирование
  • Fugu Ultra — максимальное качество за счёт более глубокого пула экспертов. Используется для Kaggle-соревнований, научного анализа, кибербезопасности и патентных исследований

Обе модели доступны через OpenAI-совместимый API, что упрощает интеграцию. Можно исключать определённых провайдеров из пула — для соответствия требованиям приватности и комплаенса.

Бенчмарки, которые говорят сами за себя

Цифры, которые опубликовала Sakana AI, выглядят серьёзно. Fugu Ultra обошла общедоступные фронтальные модели по ключевым метрикам:

  • SWE Bench Pro — 73.7 (против 69.2 у лучшего из Opus 4.8, GPT 5.5, Gemini 3.1 Pro)
  • LiveCodeBench Pro — 90.8 (против 88.4)
  • GPQA-D (научный reasoning) — 95.5 (против 94.3)
  • Humanity's Last Exam — 50.0 (против 49.8)
  • MRCRv2 (долгий контекст) — 93.6

Но ещё интереснее качественные демо. Fugu Ultra самостоятельно оптимизировал обучение нейросети за 123 эксперимента на одном GPU за 14 часов, написал рабочий решатель кубика Рубика на чистом Python (300 из 300 кубов, в среднем 19.72 хода), сыграл 4 партии в слепые шахматы и победил — включая Stockfish 2100 Elo.

Научная база: две статьи на ICLR 2026

За системой стоят две исследовательские работы — TRINITY (эволюционный координатор LLM) и Conductor (обучение оркестрации агентов через естественный язык с reinforcement learning). Это не маркетинговая надстройка — это исследовательский подход к мультиагентной координации.

Почему это важно сейчас

После блокировки Claude Mythos и Fable 5 экспортным контролем США, вопрос зависимости от одного вендора стал критическим. Fugu предлагает элегантный выход: фронтальное качество без риска блокировки — потому что система использует доступные модели из разных источников и сама решает, кто лучше справится.

Моё мнение

Sakana Fugu — это не про то, чтобы сделать ещё одну «лучшую модель». Это про системное мышление: зачем соревноваться в одиночку, когда можно скоординировать коллективный интеллект? И это ровно тот подход, который делает агрегаторы вроде STIVA.ai ценными для пользователей. Один доступ — ко множеству инструментов. Мы уже идём в правильном направлении.

Читайте также