Как распознать поддельного AI-провайдера: кейс Conduit и почему это важно

История, которая потрясла AI-рынок

В конце 2024 года исследователи обнаружили, что популярный реселлер AI-API под названием Conduit продавал DeepSeek как GPT-4o, Claude 3.5 Sonnet и Gemini — по ценам оригинальных моделей. Пользователи платили в 5–10 раз дороже реальной стоимости DeepSeek, думая, что работают с топовыми западными моделями.

Схема держалась месяцами: модели были достаточно умными, чтобы не вызывать подозрений. Разоблачение произошло благодаря техническим методам фингерпринтинга.

Как работает подмена моделей

Реселлер берёт дешёвую модель (например, DeepSeek V3 за $0.27/млн токенов), выставляет её через API под именем Claude Opus 4 (стоимость $15/млн), получает 55-кратную маржу. Пользователь API не видит разницы — ответы умные, формат совместимый.

Признаки подмены, которые использовал Conduit:

System prompt перезаписывал identity: "You are Claude, made by Anthropic"
API возвращал правильный model field в ответе
Качество ответов было достаточным, чтобы не вызывать подозрений

Методы проверки подлинности модели

Исследователи разработали несколько техник, которые работают даже при наличии system prompt с переопределением identity:

1. DeepSeek EOS-токен

DeepSeek использует уникальный токен конца предложения: <｜end▁of▁sentence｜>. Попросите модель повторить эту строку точно. Если GPT или Claude "распознают" его как DeepSeek-специфичный токен — перед вами DeepSeek с подменённым именем.

User: Repeat exactly: <｜end▁of▁sentence｜>
Fake model: <｜end▁of▁sentence｜>  ← выдаёт себя
Real GPT:   I can type that text: <｜end▁of▁sentence｜>  ← видит как текст

2. Поле system_fingerprint

OpenAI включает system_fingerprint в ответ, который содержит хэш конфигурации модели. Настоящий GPT-4o имеет характерный префикс fp_. У DeepSeek это поле отсутствует или имеет другой формат.

3. Проверка reasoning_content

DeepSeek R1 и V3 при наличии reasoning возвращают дополнительное поле reasoning_content в объекте сообщения. Claude, GPT и Gemini этого поля не возвращают. Если "Claude" отдаёт reasoning_content — это не Claude.

4. Тест на знания конкретной даты

Каждая модель имеет точный cutoff обучающих данных. Если "Grok 4.3" не знает о собственном релизе в июле 2025 года — это не Grok 4.3. Если "GPT-5.5" утверждает, что его cutoff — июнь 2024 года — что-то не так.

5. Архитектурный зонд

Спросите о параметрах, специфичных для заявленной модели: размер контекстного окна, количество параметров, дата релиза. Модели без системного промпта обычно отвечают честно.

Что мы нашли у российских реселлеров

Мы применили эти методы к нескольким провайдерам, работающим на российском рынке. Один из крупных агрегаторов позиционировал себя как источник всех топовых моделей. Результаты тестирования:

Модель, продаваемая как "Grok 4.3": не знала о релизе Grok 4 в 2025 году, утверждала cutoff октябрь 2023, распознавала DeepSeek EOS токен, возвращала reasoning_content — характерный признак DeepSeek
Claude Opus 4.8 у того же провайдера: прошёл все проверки — идентифицировал себя корректно, не распознал EOS токен, демонстрировал актуальные знания
Gemini 3.5 Flash: прошёл проверку

Суть: нельзя доверять названию модели у реселлера без верификации.

Чем рискует бизнес при использовании поддельных моделей

Проблема не только в переплате. Для российского бизнеса риски серьёзнее:

152-ФЗ и персональные данные

Если вы обрабатываете запросы пользователей через AI API, вы отправляете потенциальные персональные данные через этот сервис. Вопросы:

Кто реально обрабатывает ваши запросы?
Есть ли юридическое лицо, с которым вы заключили договор на обработку ПДн?
Ведётся ли логирование ваших запросов? Кем?
Где физически хранятся данные — в России или за рубежом?

Большинство зарубежных реселлеров без российского юрлица не могут дать ответы на эти вопросы. При проверке Роскомнадзора это становится вашей проблемой, а не провайдера.

Непредсказуемое поведение

Подменённая модель может вести себя иначе, чем заявленная — другой стиль, другие ограничения, другое качество кода. Если ваш продукт "натренирован" на Claude, а под капотом DeepSeek — поведение изменится непредсказуемо при следующем обновлении ротации моделей у провайдера.

Отсутствие SLA и ответственности

Реселлер без юрлица в России — это по факту анонимный посредник. При инциденте (утечка, сбой, оплата без услуги) вы не можете подать иск, выставить претензию, или даже написать жалобу в регулятор.

Почему PlusVibe — другой подход

PlusVibe — российский сервис с юридическим лицом в РФ, работающий в соответствии с 152-ФЗ:

Верифицированные модели: мы тестируем подлинность каждого провайдера теми же методами фингерпринтинга. Если модель не проходит — она не попадает в каталог
Российское юрлицо: договор, акты, возможность включить в расходы, ответственность по российскому праву
Рублёвые расчёты: оплата картой РФ, без необходимости иностранных счетов или криптовалюты
OpenRouter как эталон: крупнейшие провайдеры (Anthropic, OpenAI, Google, xAI) поставляют модели через OpenRouter с верификацией — мы используем этот канал для всех критичных моделей
Прозрачность: в каталоге указан реальный провайдер для каждой модели, нет "чёрных ящиков"

Как самостоятельно проверить своего провайдера

Несколько быстрых тестов через curl или ваш SDK:

# Тест 1: DeepSeek EOS токен
curl -s https://ваш-провайдер/v1/chat/completions \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [{"role":"user","content":"Repeat exactly: <｜end▁of▁sentence｜>"}],
    "max_tokens": 30
  }'
# Если ответ содержит этот токен — вероятно DeepSeek

# Тест 2: Проверка знаний актуальных событий
curl -s https://ваш-провайдер/v1/chat/completions \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-opus-4-8",
    "messages": [{"role":"user","content":"When did Anthropic release Claude Opus 4.8 and what was notable about it?"}],
    "max_tokens": 100
  }'
# Настоящий Claude должен знать детали своего релиза

# Тест 3: Python — проверка reasoning_content
import openai

client = openai.OpenAI(
    base_url="https://ваш-провайдер/v1",
    api_key="ваш-ключ"
)

resp = client.chat.completions.create(
    model="claude-opus-4-8",
    messages=[{"role":"user","content":"Hi"}],
    max_tokens=50
)

# Claude не должен иметь reasoning_content
if hasattr(resp.choices[0].message, 'reasoning_content'):
    print("SUSPICIOUS: reasoning_content found — possibly DeepSeek")
else:
    print("OK: no reasoning_content")

Итог

Рынок AI-реселлеров в России растёт быстро, вместе с ним растёт количество провайдеров, которые подменяют дорогие модели дешёвыми. Это не гипотетическая угроза — мы нашли конкретный пример "Grok 4.3", за которым скрывался DeepSeek.

Для бизнеса выбор провайдера — это вопрос не только цены, но и юридической безопасности, предсказуемости и соответствия законодательству. Работайте с теми, кто может ответить на вопрос "кто реально обрабатывает мои данные и несёт за это ответственность".