Насколько важны базовые модели ИИ?
Может показаться, что это глупый вопрос, но он часто возникает в моих беседах со стартапами в сфере ИИ. Компании, которые раньше считались просто «обёртками GPT» — то есть создавали интерфейсы на основе существующих моделей ИИ вроде ChatGPT, — теперь чувствуют себя в бизнесе вполне уверенно.
Сегодня команды стартапов сосредоточены на настройке моделей ИИ под конкретные задачи и работу с интерфейсами. Базовую модель они рассматривают как товар, который при необходимости можно легко заменить. Такой подход особенно ярко проявился на прошлой неделе на конференции Boxworks, которая, казалось, была полностью посвящена пользовательскому программному обеспечению, созданному на основе моделей ИИ.
Частично это связано с тем, что преимущества предварительного обучения — начального этапа, когда модели ИИ обучают на огромных наборах данных, — замедлились. Это не значит, что развитие ИИ остановилось, но ранние преимущества гипермасштабируемых базовых моделей достигли точки убывающей отдачи. Внимание переключилось на постобучение и обучение с подкреплением как на источники будущего прогресса.
Если вы хотите создать более качественный инструмент для кодирования с использованием ИИ, лучше сосредоточиться на тонкой настройке и дизайне интерфейса, а не тратить ещё несколько миллиардов долларов на предварительное обучение. Успех Claude Code от Anthropic показывает, что компании, создающие базовые модели, вполне способны добиться успехов и в других областях. Однако их преимущество уже не так значительно, как раньше.
Короче говоря, конкурентная среда в сфере ИИ меняется, подрывая преимущества крупнейших лабораторий ИИ. Вместо гонки за всемогущим искусственным общим интеллектом (AGI), который мог бы сравниться или превзойти человеческие способности во всех когнитивных задачах, ближайшее будущее выглядит как суета вокруг отдельных направлений бизнеса: разработка программного обеспечения, управление корпоративными данными, генерация изображений и так далее.
Неясно, даёт ли создание базовой модели какое-либо преимущество в этих областях, кроме преимущества первопроходца. Избыток альтернатив с открытым исходным кодом означает, что у базовых моделей может не быть ценового преимущества, если они проиграют конкуренцию на уровне приложений. Это может превратить такие компании, как OpenAI и Anthropic, в поставщиков бэкенда в бизнесе с низкой маржой — как выразился один основатель, «в продавцов кофейных зёрен для Starbucks».
Трудно переоценить, насколько радикальным может быть такой сдвиг для бизнеса в сфере ИИ. На протяжении всего современного бума успех ИИ был неразрывно связан с успехом компаний, создающих базовые модели, — в частности, OpenAI, Anthropic и Google. Быть оптимистично настроенным по отношению к ИИ означало верить в то, что преобразующее воздействие ИИ сделает эти компании исторически значимыми.
В прошлом году эта история усложнилась. Существует множество успешных сторонних ИИ-сервисов, но они, как правило, используют базовые модели взаимозаменяемо. Для стартапов уже не имеет значения, основана ли их продукция на GPT-5, Claude или Gemini. Они рассчитывают на возможность сменить модель в середине релиза, и конечные пользователи не заметят разницы.
Базовые модели продолжают развиваться, но уже маловероятно, что какая-либо одна компания сможет сохранить достаточно большое преимущество, чтобы доминировать в отрасли.
Как отметил венчурный капиталист Мартин Касадо из a16z в недавнем подкасте, OpenAI была первой лабораторией, которая выпустила модель для кодирования, а также генеративные модели для изображений и видео, но в итоге уступила во всех трёх категориях конкурентам. «Насколько мы можем судить, в технологическом стеке ИИ нет непреодолимых преград», — заключил Касадо.
Конечно, пока не стоит списывать со счетов компании, создающие базовые модели. У них по-прежнему есть множество устойчивых преимуществ, включая узнаваемость бренда, инфраструктуру и невероятно большие денежные резервы. Потребительская бизнес-модель OpenAI может оказаться сложнее для копирования, чем её бизнес в области кодирования, и по мере взросления сектора могут появиться и другие преимущества.
Учитывая быстрые темпы развития ИИ, нынешний интерес к постобучению может легко измениться в ближайшие шесть месяцев. Самое неопределённое — гонка за общим интеллектом может принести новые прорывы в фармацевтике или материаловедении, радикально изменив наши представления о том, что делает модели ИИ ценными.
Но пока стратегия создания всё более масштабных базовых моделей выглядит гораздо менее привлекательной, чем в прошлом году, а миллиардные расходы Meta начинают казаться весьма рискованными.
