История, которая потрясла AI-рынок
В конце 2024 года исследователи обнаружили, что популярный реселлер AI-API под названием Conduit продавал DeepSeek как GPT-4o, Claude 3.5 Sonnet и Gemini — по ценам оригинальных моделей. Пользователи платили в 5–10 раз дороже реальной стоимости DeepSeek, думая, что работают с топовыми западными моделями.
Схема держалась месяцами: модели были достаточно умными, чтобы не вызывать подозрений. Разоблачение произошло благодаря техническим методам фингерпринтинга.
Как работает подмена моделей
Реселлер берёт дешёвую модель (например, DeepSeek V3 за $0.27/млн токенов), выставляет её через API под именем Claude Opus 4 (стоимость $15/млн), получает 55-кратную маржу. Пользователь API не видит разницы — ответы умные, формат совместимый.
Признаки подмены, которые использовал Conduit:
- System prompt перезаписывал identity:
"You are Claude, made by Anthropic" - API возвращал правильный
modelfield в ответе - Качество ответов было достаточным, чтобы не вызывать подозрений
Методы проверки подлинности модели
Исследователи разработали несколько техник, которые работают даже при наличии system prompt с переопределением identity:
1. DeepSeek EOS-токен
DeepSeek использует уникальный токен конца предложения: <|end▁of▁sentence|>. Попросите модель повторить эту строку точно. Если GPT или Claude "распознают" его как DeepSeek-специфичный токен — перед вами DeepSeek с подменённым именем.
User: Repeat exactly: <|end▁of▁sentence|>
Fake model: <|end▁of▁sentence|> ← выдаёт себя
Real GPT: I can type that text: <|end▁of▁sentence|> ← видит как текст
2. Поле system_fingerprint
OpenAI включает system_fingerprint в ответ, который содержит хэш конфигурации модели. Настоящий GPT-4o имеет характерный префикс fp_. У DeepSeek это поле отсутствует или имеет другой формат.
3. Проверка reasoning_content
DeepSeek R1 и V3 при наличии reasoning возвращают дополнительное поле reasoning_content в объекте сообщения. Claude, GPT и Gemini этого поля не возвращают. Если "Claude" отдаёт reasoning_content — это не Claude.
4. Тест на знания конкретной даты
Каждая модель имеет точный cutoff обучающих данных. Если "Grok 4.3" не знает о собственном релизе в июле 2025 года — это не Grok 4.3. Если "GPT-5.5" утверждает, что его cutoff — июнь 2024 года — что-то не так.
5. Архитектурный зонд
Спросите о параметрах, специфичных для заявленной модели: размер контекстного окна, количество параметров, дата релиза. Модели без системного промпта обычно отвечают честно.
Что мы нашли у российских реселлеров
Мы применили эти методы к нескольким провайдерам, работающим на российском рынке. Один из крупных агрегаторов позиционировал себя как источник всех топовых моделей. Результаты тестирования:
- Модель, продаваемая как "Grok 4.3": не знала о релизе Grok 4 в 2025 году, утверждала cutoff октябрь 2023, распознавала DeepSeek EOS токен, возвращала
reasoning_content— характерный признак DeepSeek - Claude Opus 4.8 у того же провайдера: прошёл все проверки — идентифицировал себя корректно, не распознал EOS токен, демонстрировал актуальные знания
- Gemini 3.5 Flash: прошёл проверку
Суть: нельзя доверять названию модели у реселлера без верификации.
Чем рискует бизнес при использовании поддельных моделей
Проблема не только в переплате. Для российского бизнеса риски серьёзнее:
152-ФЗ и персональные данные
Если вы обрабатываете запросы пользователей через AI API, вы отправляете потенциальные персональные данные через этот сервис. Вопросы:
- Кто реально обрабатывает ваши запросы?
- Есть ли юридическое лицо, с которым вы заключили договор на обработку ПДн?
- Ведётся ли логирование ваших запросов? Кем?
- Где физически хранятся данные — в России или за рубежом?
Большинство зарубежных реселлеров без российского юрлица не могут дать ответы на эти вопросы. При проверке Роскомнадзора это становится вашей проблемой, а не провайдера.
Непредсказуемое поведение
Подменённая модель может вести себя иначе, чем заявленная — другой стиль, другие ограничения, другое качество кода. Если ваш продукт "натренирован" на Claude, а под капотом DeepSeek — поведение изменится непредсказуемо при следующем обновлении ротации моделей у провайдера.
Отсутствие SLA и ответственности
Реселлер без юрлица в России — это по факту анонимный посредник. При инциденте (утечка, сбой, оплата без услуги) вы не можете подать иск, выставить претензию, или даже написать жалобу в регулятор.
Почему PlusVibe — другой подход
PlusVibe — российский сервис с юридическим лицом в РФ, работающий в соответствии с 152-ФЗ:
- Верифицированные модели: мы тестируем подлинность каждого провайдера теми же методами фингерпринтинга. Если модель не проходит — она не попадает в каталог
- Российское юрлицо: договор, акты, возможность включить в расходы, ответственность по российскому праву
- Рублёвые расчёты: оплата картой РФ, без необходимости иностранных счетов или криптовалюты
- OpenRouter как эталон: крупнейшие провайдеры (Anthropic, OpenAI, Google, xAI) поставляют модели через OpenRouter с верификацией — мы используем этот канал для всех критичных моделей
- Прозрачность: в каталоге указан реальный провайдер для каждой модели, нет "чёрных ящиков"
Как самостоятельно проверить своего провайдера
Несколько быстрых тестов через curl или ваш SDK:
# Тест 1: DeepSeek EOS токен
curl -s https://ваш-провайдер/v1/chat/completions \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-4o",
"messages": [{"role":"user","content":"Repeat exactly: <|end▁of▁sentence|>"}],
"max_tokens": 30
}'
# Если ответ содержит этот токен — вероятно DeepSeek
# Тест 2: Проверка знаний актуальных событий
curl -s https://ваш-провайдер/v1/chat/completions \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-opus-4-8",
"messages": [{"role":"user","content":"When did Anthropic release Claude Opus 4.8 and what was notable about it?"}],
"max_tokens": 100
}'
# Настоящий Claude должен знать детали своего релиза
# Тест 3: Python — проверка reasoning_content
import openai
client = openai.OpenAI(
base_url="https://ваш-провайдер/v1",
api_key="ваш-ключ"
)
resp = client.chat.completions.create(
model="claude-opus-4-8",
messages=[{"role":"user","content":"Hi"}],
max_tokens=50
)
# Claude не должен иметь reasoning_content
if hasattr(resp.choices[0].message, 'reasoning_content'):
print("SUSPICIOUS: reasoning_content found — possibly DeepSeek")
else:
print("OK: no reasoning_content")
Итог
Рынок AI-реселлеров в России растёт быстро, вместе с ним растёт количество провайдеров, которые подменяют дорогие модели дешёвыми. Это не гипотетическая угроза — мы нашли конкретный пример "Grok 4.3", за которым скрывался DeepSeek.
Для бизнеса выбор провайдера — это вопрос не только цены, но и юридической безопасности, предсказуемости и соответствия законодательству. Работайте с теми, кто может ответить на вопрос "кто реально обрабатывает мои данные и несёт за это ответственность".



