Широта признаков (Feature Width)
Характеристика набора данных в машинном обучении, отражающая количество различных признаков (факторов, переменных), используемых для описания каждого объекта в выборке.
В контексте нейронных сетей и ML широта признаков напрямую влияет на способность модели улавливать сложные закономерности в данных: чем больше релевантных признаков, тем полнее представление об объекте и тем выше потенциал для точного прогнозирования. Однако избыточное число признаков может привести к переобучению, увеличению вычислительных затрат и усложнению интерпретации модели.
Аналогия из бытового мира
Представьте, что вы выбираете квартиру. Если учитывать только площадь (один признак), выбор будет очень приблизительным. Если добавить этаж, район, наличие парковки, состояние ремонта (расширить набор признаков), решение станет обоснованнее. Но если учитывать ещё и цвет обоев в каждой комнате, количество розеток и т. п. (избыточные признаки), это усложнит выбор без существенного улучшения результата.
Исторический контекст
Проблема широты признаков актуальна с первых шагов машинного обучения. В 1950–1960‑е годы, когда появились первые алгоритмы классификации, исследователи столкнулись с тем, что добавление признаков не всегда улучшает качество модели. В 1968 году Ричард Беллман описал «проклятие размерности» (curse of dimensionality) — феномен, при котором с ростом числа признаков экспоненциально возрастают требования к объёму данных и вычислительным ресурсам. Это подтолкнуло к разработке методов отбора признаков и снижения размерности (PCA, LASSO и др.).
Смежные понятия
- Глубина признаков — не устоявшийся термин, но иногда под ним понимают степень преобразования исходных признаков в скрытых слоях нейронной сети (например, в CNN признаки «углубляются» от краёв и текстур к сложным объектам).
- Отбор признаков (feature selection) — процесс выбора подмножества наиболее информативных признаков из исходного набора, чтобы сократить широту без потери качества модели.
- Извлечение признаков (feature extraction) — создание новых признаков на основе исходных (например, с помощью PCA), что может уменьшить широту при сохранении полезной информации.
Примеры использования
- В задачах компьютерного зрения исходные признаки — это пиксели изображения (широта может достигать десятков тысяч). Свёрточные сети (CNN) автоматически уменьшают широту, выделяя иерархические признаки (края → текстуры → части объектов → объекты).
- В NLP (обработка естественного языка) широта признаков зависит от способа представления текста: one‑hot encoding даёт очень широкую разреженную матрицу, а эмбеддинги (Word2Vec, BERT) сжимают информацию в плотные векторы меньшей размерности.
- В табличных данных (кредитный скоринг, прогнозирование оттока) широта признаков — это число столбцов (возраст, доход, история платежей и т. д.). Здесь часто применяют отбор признаков (например, по важности в Random Forest) или регуляризацию (L1 в логистической регрессии), чтобы сократить широту и избежать переобучения.
