Стартап Moonshot AI представил нейросетевую модель K2 Thinking

Стартап Moonshot AI, базирующийся в Китае, запустил K2 Thinking — открытую нейросетевую модель, которая способна конкурировать с дорогостоящими решениями от американских гигантов.

Это не просто ещё один языковой инструмент. Это система, которая думает пошагово, использует внешние ресурсы и способна решать задачи, требующие глубокого анализа.

Особенности K2 Thinking

Что отличает K2 Thinking от обычных больших языковых моделей — способность к многоуровневому рассуждению. Модель может выполнить до 200–300 последовательных операций с инструментами без участия человека.

Система получает сложный запрос, начинает обдумывать решение, при необходимости запускает код, проверяет результаты, ищет информацию в сети и на основе этого делает вывод. Всё это происходит автоматически, в одном потоке мышления.

Результаты тестирования

  • На тесте Humanity’s Last Exam (экзамен с тысячами вопросов экспертного уровня из более чем сотни дисциплин) K2 Thinking показала 44,9 %.
  • На BrowseComp (проверяет способность постоянно просматривать веб и искать информацию) результат составил 60,2 % при человеческом базовом уровне в 29,2 %.
  • Для задач кодирования на SWE-Bench модель достигла 71,3 % успеха.

Практический пример

Компания продемонстрировала возможности системы на практических примерах. Один из них — задача по гиперболической геометрии уровня PhD. K2 Thinking решила её через 23 вложенных цикла рассуждений и обращений к инструментам.

Система искала научные статьи, запускала Python-код для расчётов, проверяла промежуточные результаты и в итоге вывела точную формулу. Это способность планировать, думать, действовать и адаптироваться на сотнях этапов — то, что раньше отличало человеческий интеллект.

Практическое применение и доступность

Практическое применение K2 Thinking охватывает разные сферы. В разработке модель показывает улучшения при работе с HTML, React и сложными фронтенд-компонентами. Система создаёт полностью функциональные адаптивные сайты или подобия Word из единственного текстового запроса.

Конкуренция в секторе моделей с расширенным рассуждением накаляется. OpenAI и Anthropic держат свои системы закрытыми, что даёт им преимущество контроля и дохода, но ограничивает доступность. Moonshot AI выбрала другой путь — открытость.

Модель доступна на сайте и через API, что означает: любой разработчик прямо сейчас может попробовать её в деле. Это существенно отличается от подхода американских конкурентов, которые выпускают свои системы с ограничениями доступа.

Источник: hi-tech.mail.ru

Авторизация