Стартап Deccan AI привлёк 25 миллионов долларов на работу с данными для обучения ИИ

Стартап Deccan AI привлёк 25 миллионов долларов на работу с данными для обучения ИИ

С ростом спроса на обучение и доработку моделей искусственного интеллекта стартап Deccan AI, предоставляющий услуги по работе с данными после обучения и их оценке, привлёк 25 миллионов долларов в своём первом крупном раунде финансирования. Большая часть работ выполняется командой экспертов из Индии.

Раунд финансирования Series A (полностью за счёт акций) возглавил фонд A91 Partners, также в нём приняли участие Susquehanna International Group и Prosus Ventures.

В то время как ведущие лаборатории ИИ (например, OpenAI и Anthropic) разрабатывают основные модели самостоятельно, значительная часть работ после обучения — от генерации данных до оценки и обучения с подкреплением — всё чаще передаётся на аутсорс. Компании стремятся сделать системы надёжными для использования в реальных условиях, и Deccan становится одним из новых стартапов, удовлетворяющих этот спрос.

Deccan, основанная в октябре 2024 года, предоставляет услуги по:

  • улучшению возможностей моделей в кодировании и работе агентов;
  • обучению систем взаимодействию с внешними инструментами (например, API — интерфейсами программирования приложений, которые связывают модели ИИ с программными системами).

Стартап сотрудничает с передовыми лабораториями, выполняя такие задачи, как:

  • генерация экспертных отзывов;
  • проведение оценок;
  • создание сред для обучения с подкреплением.

Кроме того, Deccan обслуживает предприятия с помощью своих продуктов, включая набор инструментов для оценки Helix и платформу автоматизации операций.

Среди клиентов Deccan — Google DeepMind и Snowflake. По словам основателя Рукеша Редди, компания работает примерно с 10 клиентами и одновременно ведёт пару десятков активных проектов.

Штаб-квартира стартапа расположена в районе залива Сан-Франциско, а большая команда операционного персонала — в Хайдарабаде. В компании работает около 125 человек, и она опирается на сеть из более чем 1 миллиона участников, включая студентов, экспертов в различных областях и докторов наук. В типичный месяц активно участвуют от 5 000 до 10 000 человек.

Около 10 % участников Deccan имеют учёные степени (магистры и доктора наук), хотя их доля выше среди активных участников — в зависимости от требований проекта.

Рынок услуг по обучению ИИ быстро расширяется вместе с ростом популярности больших языковых моделей. Компании, такие как Scale AI (принадлежит Meta) и её конкурент Surge AI, а также стартапы Turing и Mercor, конкурируют за предоставление услуг по маркировке данных, оценке и обучению с подкреплением.

«Качество остаётся нерешённой проблемой, — сказал Редди. — Допустимость ошибок на этапе посттренировки близка к нулю, поскольку ошибки могут напрямую повлиять на производительность модели в производственной среде».

Работа также требует высокой оперативности: иногда лабораториям ИИ нужны большие объёмы высококачественных данных в течение нескольких дней, что затрудняет баланс между скоростью и точностью.

Сектор сталкивается с критикой из‑за условий труда и оплаты: для генерации обучающих данных часто используются большие группы временных работников. По словам Редди, заработок на платформе Deccan варьируется от 10 до 700 долларов в час, а лучшие участники могут зарабатывать до 7 000 долларов в месяц.

Несмотря на то что клиенты Deccan в основном базируются в США, большинство участников компании находятся в Индии. Редди объяснил, что Deccan сосредоточила большую часть своей рабочей силы в Индии, чтобы лучше контролировать качество:

«Многие наши конкуренты ищут экспертов в более чем 100 странах. Если у вас операции только в одной стране, поддерживать качество становится намного проще».

Этот подход подчёркивает текущую роль Индии в глобальной цепочке создания стоимости ИИ — как поставщика талантов и обучающих данных, а не разработчика передовых моделей, которые по‑прежнему сосредоточены в нескольких компаниях в США и Китае.

При этом Редди отметил, что Deccan начала привлекать таланты из нескольких других рынков, включая США, для узкоспециализированных областей, таких как геопространственные данные и проектирование полупроводников.

Редди подчеркнул, что Deccan была создана как компания, «рождённая для генеративного ИИ», в отличие от традиционных фирм по маркировке данных, которые начинали с задач компьютерного зрения. Это означает, что с самого начала компания сосредоточилась на работе, требующей более высоких навыков.

За последний год Deccan выросла в 10 раз и сейчас имеет выручку в диапазоне двузначных миллионов долларов в годовом исчислении. Около 80 % выручки приходится на пять крупнейших клиентов, что отражает концентрированный характер рынка передовых ИИ-технологий.

Источник: techcrunch.com

Авторизация