Что такое Sakana Fugu Ultra
22 июня 2026 года японская компания Sakana AI выпустила Fugu Ultra — нетипичную языковую модель. Вместо обучения одной большой нейросети с нуля, Fugu работает как оркестратор: за каждым запросом стоит специализированная команда моделей, которыми управляет обученный роутер.
Идея не нова — но Sakana утверждает, что впервые реализовала обученную мультиагентную маршрутизацию, где роутер сам является языковой моделью и может рекурсивно вызывать себя для сложных подзадач.
Архитектура: почему это не просто ансамбль
Классический ансамбль моделей — это «запроси всех, возьми лучший ответ». Fugu работает иначе:
- Роутер (сам LLM) анализирует задачу и решает, какой специалист нужен: кодирование, математика, веб-поиск, анализ изображений.
- Специализированная модель решает подзадачу.
- Роутер собирает ответы, при необходимости запускает ещё итерации, формирует финальный ответ.
Пул базовых моделей не раскрывается, но по характеристикам (поддержка vision, веб-поиск, reasoning) очевидно, что за ним стоят несколько провайдеров класса frontier.
Бенчмарки и реальность
Sakana AI заявляет превосходство над GPT-5.5 и Claude Opus 4.8 на SWE-Bench Pro и TerminalBench, паритет с Fable 5 и Claude Mythos на математических и агентных задачах.
Независимые тесты первых дней показывают смешанную картину:
- Сильные стороны: сложный code review, многошаговые агентные задачи, задачи, требующие синтеза нескольких экспертных областей.
- Слабые стороны: задержки. Fugu Ultra честно тратит 2–30 минут на сложный запрос — это цена оркестрации. Для интерактивных задач не подходит.
- На простых запросах избыточен: роутер всё равно запускает несколько агентов.
Вывод: Fugu Ultra — это инструмент для сложных batch-задач, а не замена быстрому чату.
Технические характеристики
| Параметр | Значение |
|---|---|
| Контекстное окно | 1 000 000 токенов |
| Максимальный вывод | 128 000 токенов |
| Vision (изображения) | Да |
| Веб-поиск | Встроен |
| Tool calling | Да |
| Reasoning/thinking | Да (billing as output) |
Цена
Через OpenRouter: $5 / 1M input токенов и $30 / 1M output токенов. Дороже Claude Opus 4.8 по output (Opus — $25), но оркестрационные токены внутри уже включены в цену.
Доступ в России через PlusVibe
Сайт Sakana AI и OpenRouter напрямую недоступны из России без VPN. Через PlusVibe Fugu Ultra доступна по OpenAI-совместимому API — ни VPN, ни зарубежные карты не нужны.
Пример запроса:
curl https://plusvibeapi.ru/v1/chat/completions \
-H "Authorization: Bearer $PLUSVIBE_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "fugu-ultra",
"messages": [
{"role": "user", "content": "Проведи полный code review этого Python-модуля и предложи рефакторинг"}
]
}'
Или через Python SDK:
from openai import OpenAI
client = OpenAI(
api_key="sk-pv-...",
base_url="https://plusvibeapi.ru/v1",
)
response = client.chat.completions.create(
model="fugu-ultra",
messages=[{"role": "user", "content": "Задача..."}],
)
print(response.choices[0].message.content)
Когда использовать Fugu Ultra, а когда — нет
Подходит:
- Глубокий анализ больших кодовых баз
- Сложные research-задачи, требующие синтеза из разных источников
- Batch-пайплайны без требований к latency
- Задачи, которые отдельные модели решают плохо из-за узкой специализации
Не подходит:
- Интерактивный чат (задержки секунды → минуты)
- Простые однотипные запросы (переплата за оркестрацию)
- Стриминг в реальном времени
Итог
Sakana Fugu Ultra — первая серийная реализация мультиагентной оркестрации уровня frontier. Подход интересен: не нужно тренировать одну гигантскую модель — достаточно научить роутер распределять задачи. На сложных агентных бенчмарках результаты убедительны, но ценой latency.
Для российских разработчиков Fugu Ultra доступна через PlusVibe — регистрируйтесь, получайте 100 ₽ на баланс и тестируйте.


