Sakana Fugu Ultra: мультиагентный ИИ, который соперничает с Fable и Mythos

Что такое Sakana Fugu Ultra

22 июня 2026 года японская компания Sakana AI выпустила Fugu Ultra — нетипичную языковую модель. Вместо обучения одной большой нейросети с нуля, Fugu работает как оркестратор: за каждым запросом стоит специализированная команда моделей, которыми управляет обученный роутер.

Идея не нова — но Sakana утверждает, что впервые реализовала обученную мультиагентную маршрутизацию, где роутер сам является языковой моделью и может рекурсивно вызывать себя для сложных подзадач.

Архитектура: почему это не просто ансамбль

Классический ансамбль моделей — это «запроси всех, возьми лучший ответ». Fugu работает иначе:

Роутер (сам LLM) анализирует задачу и решает, какой специалист нужен: кодирование, математика, веб-поиск, анализ изображений.
Специализированная модель решает подзадачу.
Роутер собирает ответы, при необходимости запускает ещё итерации, формирует финальный ответ.

Пул базовых моделей не раскрывается, но по характеристикам (поддержка vision, веб-поиск, reasoning) очевидно, что за ним стоят несколько провайдеров класса frontier.

Бенчмарки и реальность

Sakana AI заявляет превосходство над GPT-5.5 и Claude Opus 4.8 на SWE-Bench Pro и TerminalBench, паритет с Fable 5 и Claude Mythos на математических и агентных задачах.

Независимые тесты первых дней показывают смешанную картину:

Сильные стороны: сложный code review, многошаговые агентные задачи, задачи, требующие синтеза нескольких экспертных областей.
Слабые стороны: задержки. Fugu Ultra честно тратит 2–30 минут на сложный запрос — это цена оркестрации. Для интерактивных задач не подходит.
На простых запросах избыточен: роутер всё равно запускает несколько агентов.

Вывод: Fugu Ultra — это инструмент для сложных batch-задач, а не замена быстрому чату.

Технические характеристики

Параметр	Значение
Контекстное окно	1 000 000 токенов
Максимальный вывод	128 000 токенов
Vision (изображения)	Да
Веб-поиск	Встроен
Tool calling	Да
Reasoning/thinking	Да (billing as output)

Цена

Через OpenRouter: $5 / 1M input токенов и $30 / 1M output токенов. Дороже Claude Opus 4.8 по output (Opus — $25), но оркестрационные токены внутри уже включены в цену.

Доступ в России через PlusVibe

Сайт Sakana AI и OpenRouter напрямую недоступны из России без VPN. Через PlusVibe Fugu Ultra доступна по OpenAI-совместимому API — ни VPN, ни зарубежные карты не нужны.

Пример запроса:

curl https://plusvibeapi.ru/v1/chat/completions \
  -H "Authorization: Bearer $PLUSVIBE_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "fugu-ultra",
    "messages": [
      {"role": "user", "content": "Проведи полный code review этого Python-модуля и предложи рефакторинг"}
    ]
  }'

Или через Python SDK:

from openai import OpenAI

client = OpenAI(
    api_key="sk-pv-...",
    base_url="https://plusvibeapi.ru/v1",
)

response = client.chat.completions.create(
    model="fugu-ultra",
    messages=[{"role": "user", "content": "Задача..."}],
)
print(response.choices[0].message.content)

Когда использовать Fugu Ultra, а когда — нет

Подходит:

Глубокий анализ больших кодовых баз
Сложные research-задачи, требующие синтеза из разных источников
Batch-пайплайны без требований к latency
Задачи, которые отдельные модели решают плохо из-за узкой специализации

Не подходит:

Интерактивный чат (задержки секунды → минуты)
Простые однотипные запросы (переплата за оркестрацию)
Стриминг в реальном времени

Итог

Sakana Fugu Ultra — первая серийная реализация мультиагентной оркестрации уровня frontier. Подход интересен: не нужно тренировать одну гигантскую модель — достаточно научить роутер распределять задачи. На сложных агентных бенчмарках результаты убедительны, но ценой latency.

Для российских разработчиков Fugu Ultra доступна через PlusVibe — регистрируйтесь, получайте 100 ₽ на баланс и тестируйте.