Парадигма обучения (Learning Paradigm)
Что такое Парадигма обучения (Learning Paradigm)?
Парадигма обучения — это основополагающий подход или модель, определяющая принципы, методы и порядок обучения нейронных сетей и алгоритмов машинного обучения.
Аналогия из бытового мира
Представьте, что вы учите ребёнка читать. Можно идти разными путями:Каждая из этих стратегий — своя «парадигма обучения», со своими методами, ролями ученика и наставника, критериями успеха.
- показывать буквы и слоги, объясняя правила (как в классической школе) — это похоже на обучение с учителем;
- дать стопку книг и сказать «разбирайся сам» — это напоминает неконтролируемое обучение;
- позволить ребёнку читать, а потом хвалить или поправлять его — это сродни обучению с подкреплением.
Исторический контекст
Понятие парадигмы в науке широко популяризовал Томас Кун в книге «Структура научных революций» (1962), но в ML оно приобрело более прикладное значение. В истории машинного обучения можно выделить несколько ключевых сдвигов парадигм:
- 1950–1960‑е: первые перцептроны и идеи обучения с учителем (Фрэнк Розенблатт).
- 1980–1990‑е: возрождение нейронных сетей, обратное распространение ошибки, рост интереса к обучению с учителем.
- 2000–2010‑е: взрывной рост неконтролируемого обучения и предобучения (например, автоэнкодеры, Word2Vec), а также усиление роли обучения с подкреплением (AlphaGo, 2016).
- 2020‑е: появление и распространение парадигмы предварительного обучения на больших данных (pre-training) и тонкой настройки (fine-tuning) — GPT, BERT, Stable Diffusion и др.
Смежные понятия и различия
- Алгоритм обучения — конкретный метод оптимизации (SGD, Adam и т. п.), который работает в рамках парадигмы.
- Архитектура модели — строение нейросети (CNN, RNN, Transformer), которое тоже выбирается в соответствии с парадигмой.
- Задача ML (классификация, регрессия, генерация) — определяет цель, но не способ обучения; парадигма задаёт, как мы будем к этой цели идти.
Примеры использования
Обучение с учителем (supervised learning)
- задачи классификации изображений (ResNet, ViT);
- машинный перевод (Seq2Seq, Transformer);
- распознавание речи (WaveNet, Whisper).
Неконтролируемое обучение (unsupervised learning)
- кластеризация данных (K-means, DBSCAN);
- снижение размерности (PCA, t-SNE);
- генеративные модели (GAN, VAE).
Обучение с подкреплением (reinforcement learning)
- игры (AlphaGo, Dota 2 от OpenAI);
- робототехника (обучение манипуляторов);
- рекомендательные системы (динамическая оптимизация предложений).
Предварительное обучение и тонкая настройка (pre-training & fine-tuning)
- языковые модели (GPT-3, Llama);
- мультимодальные модели (CLIP, DALL·E);
- адаптация моделей к узким доменам (медицина, юриспруденция).
