DeepSeek стремительно набирает популярность

Китайская лаборатория искусственного интеллекта DeepSeek привлекла широкое внимание на этой неделе после того, как её приложение чат-бота поднялось на вершину чартов Apple App Store и Google Play.

Модели ИИ от DeepSeek, обученные с использованием эффективных вычислительных методов, заставили аналитиков с Уолл-стрит и технологов задуматься о том, сможет ли США сохранить своё лидерство в гонке ИИ и сохранится ли спрос на ИИ-чипы.

Происхождение DeepSeek

DeepSeek поддерживается High-Flyer Capital Management — китайским количественным хедж-фондом, который использует ИИ для принятия торговых решений.

Сооснователь High-Flyer Лян Вэньфэн, увлекающийся ИИ, запустил фонд в 2019 году, сосредоточившись на разработке и внедрении ИИ-алгоритмов. В 2023 году High-Flyer создал DeepSeek как лабораторию для исследования ИИ-инструментов, отдельную от финансового бизнеса. Впоследствии лаборатория превратилась в самостоятельную компанию с тем же названием.

С самого начала DeepSeek создавала собственные кластеры дата-центров для обучения моделей. Однако, как и другие ИИ-компании в Китае, она столкнулась с ограничениями из-за запрета на экспорт оборудования из США. Для обучения одной из последних моделей компании пришлось использовать чипы Nvidia H800 — менее мощную версию чипа H100, доступного американским компаниям.

Технические достижения DeepSeek

DeepSeek представила свой первый набор моделей — DeepSeek Coder, DeepSeek LLM и DeepSeek Chat — в ноябре 2023 года. Однако внимание индустрии ИИ было привлечено только весной прошлого года, когда стартап выпустил семейство моделей следующего поколения DeepSeek-V2.

DeepSeek-V2, система для анализа текста и изображений общего назначения, показала хорошие результаты в различных тестах ИИ и была значительно дешевле в эксплуатации, чем сопоставимые модели того времени. Это заставило внутренних конкурентов, включая ByteDance и Alibaba, снизить цены на использование некоторых своих моделей, а некоторые сделать полностью бесплатными.

DeepSeek-V3, запущенная в декабре 2024 года, ещё больше укрепила репутацию компании. По внутренним тестам DeepSeek, V3 превосходит как доступные для скачивания модели, такие как Llama от Meta, так и «закрытые» модели, доступные только через API, например GPT-4o от OpenAI.

Не менее впечатляющей является модель DeepSeek R1 с функцией рассуждения. По заявлениям компании, R1 демонстрирует результаты, сопоставимые с моделью o1 от OpenAI в ключевых тестах. Модель эффективно проверяет факты, что помогает избежать типичных ошибок, свойственных другим моделям. Однако у R1, DeepSeek V3 и других моделей DeepSeek есть недостаток: как разработки китайского ИИ, они проходят проверку интернет-регулятора Китая, чтобы их ответы «отражали основные социалистические ценности».

Реакция рынка и ограничения

В марте DeepSeek превысила 16,5 миллионов посещений. В мае компания выпустила обновлённую версию своей модели ИИ с функцией рассуждения R1 на платформе разработчиков Hugging Face. В сентябре DeepSeek представила экспериментальную модель V3.2-exp, предназначенную для значительного снижения затрат на вывод данных при работе с длинными контекстами.

Бизнес-модель DeepSeek не совсем ясна. Компания устанавливает цены на свои продукты и услуги значительно ниже рыночной стоимости, а некоторые предлагает бесплатно. При этом она не привлекает средства инвесторов, несмотря на большой интерес со стороны венчурных фондов.

Успех DeepSeek вызвал различные реакции: от описания его как «переворачивающего индустрию ИИ» до обвинений в «чрезмерном ажиотаже». Успех компании частично стал причиной падения акций Nvidia на 18 % в январе и вызвал публичную реакцию со стороны CEO OpenAI Сэма Альтмана. В марте бюро Министерства торговли США сообщили сотрудникам, что DeepSeek будет запрещена на правительственных устройствах.

Некоторые компании и целые страны, включая Южную Корею и штат Нью-Йорк, запретили использование DeepSeek. В мае вице-председатель и президент Microsoft Брэд Смит заявил на слушаниях в Сенате, что сотрудникам Microsoft запрещено использовать DeepSeek из-за опасений, связанных с безопасностью данных и пропагандой.

Будущее DeepSeek пока неясно. Улучшение моделей — это данность, но правительство США, похоже, всё больше обеспокоено тем, что оно воспринимает как вредное иностранное влияние.

Источник: techcrunch.com

Авторизация