Стартап Deccan AI привлёк 25 миллионов долларов на работу с данными для обучения ИИ
Стартап Deccan AI привлёк 25 миллионов долларов на работу с данными для обучения ИИ
С ростом спроса на обучение и доработку моделей искусственного интеллекта стартап Deccan AI, предоставляющий услуги по работе с данными после обучения и их оценке, привлёк 25 миллионов долларов в своём первом крупном раунде финансирования. Большая часть работ выполняется командой экспертов из Индии.
Раунд финансирования Series A (полностью за счёт акций) возглавил фонд A91 Partners, также в нём приняли участие Susquehanna International Group и Prosus Ventures.
В то время как ведущие лаборатории ИИ (например, OpenAI и Anthropic) разрабатывают основные модели самостоятельно, значительная часть работ после обучения — от генерации данных до оценки и обучения с подкреплением — всё чаще передаётся на аутсорс. Компании стремятся сделать системы надёжными для использования в реальных условиях, и Deccan становится одним из новых стартапов, удовлетворяющих этот спрос.
Deccan, основанная в октябре 2024 года, предоставляет услуги по:
- улучшению возможностей моделей в кодировании и работе агентов;
- обучению систем взаимодействию с внешними инструментами (например, API — интерфейсами программирования приложений, которые связывают модели ИИ с программными системами).
Стартап сотрудничает с передовыми лабораториями, выполняя такие задачи, как:
- генерация экспертных отзывов;
- проведение оценок;
- создание сред для обучения с подкреплением.
Кроме того, Deccan обслуживает предприятия с помощью своих продуктов, включая набор инструментов для оценки Helix и платформу автоматизации операций.
Среди клиентов Deccan — Google DeepMind и Snowflake. По словам основателя Рукеша Редди, компания работает примерно с 10 клиентами и одновременно ведёт пару десятков активных проектов.
Штаб-квартира стартапа расположена в районе залива Сан-Франциско, а большая команда операционного персонала — в Хайдарабаде. В компании работает около 125 человек, и она опирается на сеть из более чем 1 миллиона участников, включая студентов, экспертов в различных областях и докторов наук. В типичный месяц активно участвуют от 5 000 до 10 000 человек.
Около 10 % участников Deccan имеют учёные степени (магистры и доктора наук), хотя их доля выше среди активных участников — в зависимости от требований проекта.
Рынок услуг по обучению ИИ быстро расширяется вместе с ростом популярности больших языковых моделей. Компании, такие как Scale AI (принадлежит Meta) и её конкурент Surge AI, а также стартапы Turing и Mercor, конкурируют за предоставление услуг по маркировке данных, оценке и обучению с подкреплением.
«Качество остаётся нерешённой проблемой, — сказал Редди. — Допустимость ошибок на этапе посттренировки близка к нулю, поскольку ошибки могут напрямую повлиять на производительность модели в производственной среде».
Работа также требует высокой оперативности: иногда лабораториям ИИ нужны большие объёмы высококачественных данных в течение нескольких дней, что затрудняет баланс между скоростью и точностью.
Сектор сталкивается с критикой из‑за условий труда и оплаты: для генерации обучающих данных часто используются большие группы временных работников. По словам Редди, заработок на платформе Deccan варьируется от 10 до 700 долларов в час, а лучшие участники могут зарабатывать до 7 000 долларов в месяц.
Несмотря на то что клиенты Deccan в основном базируются в США, большинство участников компании находятся в Индии. Редди объяснил, что Deccan сосредоточила большую часть своей рабочей силы в Индии, чтобы лучше контролировать качество:
«Многие наши конкуренты ищут экспертов в более чем 100 странах. Если у вас операции только в одной стране, поддерживать качество становится намного проще».
Этот подход подчёркивает текущую роль Индии в глобальной цепочке создания стоимости ИИ — как поставщика талантов и обучающих данных, а не разработчика передовых моделей, которые по‑прежнему сосредоточены в нескольких компаниях в США и Китае.
При этом Редди отметил, что Deccan начала привлекать таланты из нескольких других рынков, включая США, для узкоспециализированных областей, таких как геопространственные данные и проектирование полупроводников.
Редди подчеркнул, что Deccan была создана как компания, «рождённая для генеративного ИИ», в отличие от традиционных фирм по маркировке данных, которые начинали с задач компьютерного зрения. Это означает, что с самого начала компания сосредоточилась на работе, требующей более высоких навыков.
За последний год Deccan выросла в 10 раз и сейчас имеет выручку в диапазоне двузначных миллионов долларов в годовом исчислении. Около 80 % выручки приходится на пять крупнейших клиентов, что отражает концентрированный характер рынка передовых ИИ-технологий.
