Стартап Moonshot AI представил нейросетевую модель K2 Thinking
Стартап Moonshot AI, базирующийся в Китае, запустил K2 Thinking — открытую нейросетевую модель, которая способна конкурировать с дорогостоящими решениями от американских гигантов.
Это не просто ещё один языковой инструмент. Это система, которая думает пошагово, использует внешние ресурсы и способна решать задачи, требующие глубокого анализа.
Особенности K2 Thinking
Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200–300 последовательных операций с инструментами без участия человека.
Система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Всё это происходит автоматически, в одном потоке мышления.
Результаты тестирования
- На тесте Humanity’s Last Exam (экзамен с тысячами вопросов экспертного уровня из более чем сотни дисциплин) K2 Thinking показала 44,9 %.
- На BrowseComp (проверяет способность постоянно просматривать веб и искать информацию) результат составил 60,2 % при человеческом базовом уровне в 29,2 %.
- Для задач кодирования на SWE-Bench модель достигла 71,3 % успеха.
Практический пример
Компания продемонстрировала возможности системы на практических примерах. Один из них — задача по гиперболической геометрии уровня PhD. K2 Thinking решила её через 23 вложенных цикла рассуждений и обращений к инструментам.
Система искала научные статьи, запускала Python-код для расчётов, проверяла промежуточные результаты и в итоге вывела точную формулу. Это способность планировать, думать, действовать и адаптироваться на сотнях этапов — то, что раньше отличало человеческий интеллект.
Практическое применение и доступность
Практическое применение K2 Thinking охватывает разные сферы. В разработке модель показывает улучшения при работе с HTML, React и сложными фронтенд-компонентами. Система создаёт полностью функциональные адаптивные сайты или подобия Word из единственного текстового запроса.
Конкуренция в секторе моделей с расширенным рассуждением накаляется. OpenAI и Anthropic держат свои системы закрытыми, что даёт им преимущество контроля и дохода, но ограничивает доступность. Moonshot AI выбрала другой путь — открытость.
Модель доступна на сайте и через API, что означает: любой разработчик прямо сейчас может попробовать её в деле. Это существенно отличается от подхода американских конкурентов, которые выпускают свои системы с ограничениями доступа.
