Anthropic обвиняет китайские компании в создании тысяч фейковых аккаунтов для копирования её ИИ-модели
Anthropic обвиняет китайские компании в дистилляции её ИИ-модели
Компания Anthropic обвинила три китайские ИИ-компании — DeepSeek, Moonshot AI и MiniMax — в создании более чем 24 000 фейковых аккаунтов для взаимодействия с её моделью Claude. С помощью этих аккаунтов компании якобы провели свыше 16 миллионов диалогов, используя метод, известный как дистилляция.
По данным Anthropic, лаборатории целенаправленно тестировали наиболее отличительные возможности Claude: агентное рассуждение, использование инструментов и программирование.
Что такое дистилляция?
Дистилляция — распространённый метод обучения, который ИИ-лаборатории применяют для создания более компактных и дешёвых версий своих моделей. Однако конкуренты могут использовать его для копирования наработок других компаний.
Ранее OpenAI направила меморандум законодателям Палаты представителей, обвинив DeepSeek в использовании дистилляции для имитации своих продуктов.
Подробности по каждой компании
- DeepSeek: более 150 000 диалогов, нацеленных на улучшение базовой логики и согласования, в частности, на поиск безопасных альтернатив запросам, чувствительным к цензуре.
- Moonshot AI: свыше 3,4 миллиона диалогов, ориентированных на агентное рассуждение, использование инструментов, программирование, анализ данных, разработку агентов для работы с компьютером и компьютерное зрение. В прошлом месяце компания выпустила новую открытую модель Kimi K2.5 и агента для программирования.
- MiniMax: 13 миллионов диалогов, нацеленных на агентное программирование, использование инструментов и оркестрацию. Anthropic утверждает, что наблюдала за действиями MiniMax, когда компания перенаправила почти половину своего трафика для извлечения возможностей из последней версии Claude.
Реакция и последствия
Anthropic заявила, что продолжит инвестировать в защиту от атак с дистилляцией, но призывает к скоординированным действиям со стороны ИИ-индустрии, облачных провайдеров и политиков.
Обвинения прозвучали на фоне дебатов о строгости контроля за экспортом передовых ИИ-чипов в Китай. В прошлом месяце администрация Трампа официально разрешила американским компаниям, таким как Nvidia, экспортировать в Китай передовые ИИ-чипы (например, H200).
«Атаки с дистилляцией подтверждают необходимость контроля за экспортом: ограничение доступа к чипам ограничивает как прямое обучение моделей, так и масштабы незаконной дистилляции», — говорится в блоге Anthropic.
Дмитрий Альперович, председатель аналитического центра Silverado Policy Accelerator и соучредитель CrowdStrike, заявил TechCrunch, что не удивлён этими атаками:
«Уже давно было ясно, что часть причин быстрого прогресса китайских ИИ-моделей — это кража через дистилляцию передовых американских моделей. Теперь мы знаем это наверняка».
Anthropic также предупредила, что дистилляция не только угрожает доминированию США в области ИИ, но и может создать риски для национальной безопасности. В блоге компании отмечается, что модели, созданные с помощью незаконной дистилляции, вряд ли сохранят защитные механизмы, предотвращающие использование ИИ для разработки биологического оружия или проведения злонамеренных кибератак.
