Обучение без учителя (Unsupervised Learning)
Метод машинного обучения, при котором модель анализирует неразмеченные данные и выявляет в них скрытые структуры, закономерности или группировки без использования заранее заданных целевых меток (ответов).
В отличие от обучения с учителем, где нейросеть «учится» на примерах с известными ответами (как школьник, решающий задачи с готовыми решениями в конце учебника), при обучении без учителя модель действует подобно исследователю, который впервые изучает неизведанную территорию. Она сама ищет ориентиры, выделяет области со схожими признаками, нащупывает границы между разными зонами — без карты и подсказок.
Исторически обучение без учителя восходит к ранним работам по статистике и кластерному анализу 1950–1960‑х годов. Важный вклад внесли такие методы, как k‑средних (k‑means, предложен в 1967 г.) и анализ главных компонент (PCA, разработан в 1901 г. Карлом Пирсоном, но активно применялся в ML позже). В 1980–1990‑е годы с развитием нейронных сетей появились самоорганизующиеся карты Кохонена (1982 г.), а в 2000‑е — алгоритмы вроде DBSCAN и t‑SNE, расширившие арсенал методов для выявления структур в данных.
Чем отличается от смежных подходов:
- Обучение с учителем требует размеченных данных (каждая запись имеет «правильный ответ»); модель учится предсказывать метки.
- Обучение с частичным привлечением учителя (semi‑supervised learning) использует смесь размеченных и неразмеченных данных.
- Обучение с подкреплением (reinforcement learning) учит агента принимать решения через взаимодействие со средой и получение наград/штрафов, а не через анализ статичных данных.
Примеры использования:
- Кластеризация: группировка клиентов по поведению (k‑means, DBSCAN), выделение тем в коллекции документов (LDA).
- Снижение размерности: визуализация высокомерных данных (t‑SNE, UMAP), сжатие признаков для ускорения обучения (PCA).
- Обнаружение аномалий: выявление мошеннических транзакций или сбоев в системах (автоэнкодеры, Isolation Forest).
- Ассоциативные правила: поиск частых сочетаний товаров в корзинах покупателей (алгоритм Apriori).
Популярные реализации и алгоритмы:
- k‑means,
- DBSCAN,
- PCA,
- t‑SNE,
- автоэнкодеры (autoencoders),
- самоорганизующиеся карты Кохонена (SOM),
- алгоритм Apriori.
