Парадигма обучения (Learning Paradigm)

Что такое Парадигма обучения (Learning Paradigm)?

Парадигма обучения — это основополагающий подход или модель, определяющая принципы, методы и порядок обучения нейронных сетей и алгоритмов машинного обучения.

В контексте ИИ и ML парадигма обучения задаёт «правила игры»: как модель получает данные, каким образом извлекает из них закономерности, как корректирует свои параметры и достигает поставленной цели. Это своего рода «методологическая рамка», в которой разворачивается процесс обучения модели — от постановки задачи до оценки результатов.

Аналогия из бытового мира

Представьте, что вы учите ребёнка читать. Можно идти разными путями:
показывать буквы и слоги, объясняя правила (как в классической школе) — это похоже на обучение с учителем;
дать стопку книг и сказать «разбирайся сам» — это напоминает неконтролируемое обучение;
позволить ребёнку читать, а потом хвалить или поправлять его — это сродни обучению с подкреплением.
Каждая из этих стратегий — своя «парадигма обучения», со своими методами, ролями ученика и наставника, критериями успеха.

Исторический контекст

Понятие парадигмы в науке широко популяризовал Томас Кун в книге «Структура научных революций» (1962), но в ML оно приобрело более прикладное значение. В истории машинного обучения можно выделить несколько ключевых сдвигов парадигм:

1950–1960‑е: первые перцептроны и идеи обучения с учителем (Фрэнк Розенблатт).
1980–1990‑е: возрождение нейронных сетей, обратное распространение ошибки, рост интереса к обучению с учителем.
2000–2010‑е: взрывной рост неконтролируемого обучения и предобучения (например, автоэнкодеры, Word2Vec), а также усиление роли обучения с подкреплением (AlphaGo, 2016).
2020‑е: появление и распространение парадигмы предварительного обучения на больших данных (pre-training) и тонкой настройки (fine-tuning) — GPT, BERT, Stable Diffusion и др.

Смежные понятия и различия

Алгоритм обучения — конкретный метод оптимизации (SGD, Adam и т. п.), который работает в рамках парадигмы.
Архитектура модели — строение нейросети (CNN, RNN, Transformer), которое тоже выбирается в соответствии с парадигмой.
Задача ML (классификация, регрессия, генерация) — определяет цель, но не способ обучения; парадигма задаёт, как мы будем к этой цели идти.

Примеры использования

Обучение с учителем (supervised learning)

задачи классификации изображений (ResNet, ViT);
машинный перевод (Seq2Seq, Transformer);
распознавание речи (WaveNet, Whisper).

Неконтролируемое обучение (unsupervised learning)

кластеризация данных (K-means, DBSCAN);
снижение размерности (PCA, t-SNE);
генеративные модели (GAN, VAE).

Обучение с подкреплением (reinforcement learning)

игры (AlphaGo, Dota 2 от OpenAI);
робототехника (обучение манипуляторов);
рекомендательные системы (динамическая оптимизация предложений).

Предварительное обучение и тонкая настройка (pre-training & fine-tuning)

языковые модели (GPT-3, Llama);
мультимодальные модели (CLIP, DALL·E);
адаптация моделей к узким доменам (медицина, юриспруденция).