Обучение с учителем (Supervised Learning)
Что такое Обучение с учителем (Supervised Learning)?
Метод машинного обучения, при котором модель обучается на размеченных данных: для каждого примера в наборе данных заданы входные признаки и соответствующие им правильные ответы (метки).
Представьте, что вы учите ребёнка различать фрукты. Вы показываете ему яблоко и говорите: «Это яблоко», затем грушу — «Это груша», и так далее. Ребёнок наблюдает, запоминает признаки (цвет, форму, текстуру) и учится сопоставлять их с названиями. В обучении с учителем модель делает примерно то же самое: ей «показывают» данные с подсказкой («это кошка», «это собака»), и она учится распознавать паттерны.
Исторический контекст
Идея обучения с учителем восходит к ранним работам в области искусственного интеллекта и статистики. В 1950–1960‑х годах появились первые алгоритмы, использующие размеченные данные — например, перцептрон Фрэнка Розенблатта (1958). В последующие десятилетия метод развивался благодаря появлению новых алгоритмов (логистическая регрессия, метод опорных векторов, решающие деревья) и росту объёмов данных. В 2000–2010‑х годах обучение с учителем стало ключевым подходом в глубоком обучении, особенно в задачах компьютерного зрения и обработки естественного языка.
Смежные понятия и различия
- Обучение без учителя — модель работает с неразмеченными данными, ищет скрытые структуры или группировки (кластеризацию), не имея «правильных» ответов.
- Обучение с подкреплением — модель учится, взаимодействуя со средой и получая обратную связь в виде наград/штрафов, а не готовых меток.
- Полуобучение (semi-supervised learning) — комбинация размеченных и неразмеченных данных: модель использует немного размеченных примеров и много неразмеченных, чтобы улучшить обобщение.
Примеры использования
- классификация изображений (например, сеть ResNet определяет, что на фото — кошка или собака);
- распознавание речи (модели типа Wav2Vec преобразуют аудио в текст, опираясь на размеченные аудиозаписи с транскрипциями);
- анализ тональности текста (модель определяет, положительный или отрицательный отзыв, на основе размеченных примеров);
- прогнозирование цен (регрессионные модели предсказывают стоимость недвижимости, обучаясь на данных с известными ценами).
Популярные реализации и архитектуры
- логистическая регрессия;
- метод опорных векторов (SVM);
- случайные леса (Random Forest);
- свёрточные нейронные сети (CNN) для изображений;
- трансформеры (например, BERT) для текста.
