Доменная адаптация (Domain Adaptation)
Что такое Доменная адаптация (Domain Adaptation)?
Метод в машинном обучении, направленный на повышение качества работы модели при переходе от исходного (исходного обучающего) домена к целевому домену, где распределение данных отличается.
Аналогия из бытового мира
Представьте, что вы научились водить автомобиль с механической коробкой передач. Когда вы впервые садитесь за руль машины с автоматической коробкой, вам не нужно заново учиться вождению с нуля — вы адаптируете уже имеющиеся навыки к новым условиям. Доменная адаптация в ML работает похожим образом: модель «перестраивает» свои знания, чтобы эффективно работать в новой среде.
Исторический контекст
Проблема доменной адаптации стала особенно актуальной с развитием глубокого обучения и расширением сфер применения нейросетей. Первые серьёзные работы в этой области начали появляться в 2000‑х годах, однако настоящий всплеск интереса пришёлся на 2010‑е, когда глубокое обучение стало доминирующим подходом в компьютерном зрении, обработке естественного языка и других областях. Важный вклад в развитие методов доменной адаптации внесли исследования в области переноса знаний (transfer learning) и инвариантных представлений (invariant representations).
Смежные понятия и различия
- Перенос обучения (transfer learning) — более общее понятие, включающее в себя доменную адаптацию как частный случай. В transfer learning модель, обученная на одной задаче, применяется к другой, возможно, близкой задаче. Доменная адаптация фокусируется именно на разнице распределений данных между доменами при сохранении задачи.
- Обучение с подкреплением (reinforcement learning) — подход, где модель учится, взаимодействуя с окружающей средой и получая сигналы обратной связи. В отличие от доменной адаптации, здесь нет явного разделения на исходный и целевой домены; модель учится «с нуля» в заданной среде.
- Аугментация данных (data augmentation) — техника увеличения объёма обучающей выборки путём внесения небольших изменений в существующие данные (например, поворот изображения). В отличие от доменной адаптации, аугментация не решает проблему различия распределений между доменами, а лишь расширяет обучающую выборку в рамках одного домена.
Примеры использования
- Компьютерное зрение: модель, обученная на фотографиях объектов, адаптируется для работы с рентгеновскими снимками или изображениями с дронов. Например, методы доменной адаптации применяются для улучшения работы систем распознавания лиц в условиях низкой освещённости или для анализа медицинских изображений.
- Обработка естественного языка (NLP): модель, обученная на новостных статьях, адаптируется для анализа отзывов в социальных сетях или медицинских текстов. Примером может служить адаптация моделей машинного перевода для работы с узкоспециализированной терминологией (например, юридической или медицинской).
- Автономные системы: модель, обученная в симуляторе, адаптируется для работы в реальных условиях. Например, алгоритмы управления беспилотными автомобилями, обученные в виртуальной среде, адаптируются к реальным дорожным условиям.
Популярные методы доменной адаптации
- Domain-Adversarial Training of Neural Networks (DANN) — метод, использующий adversarial-подход для обучения инвариантных к домену представлений.
- CORAL (Correlation Alignment) — метод выравнивания статистических характеристик (корреляций) между исходным и целевым доменами.
- Fine-tuning с учётом домена — дообучение предварительно обученной модели на небольшом наборе данных целевого домена с использованием специальных стратегий (например, постепенного размораживания слоёв).
