Целевая переменная (Target Variable)
Целевая переменная — это переменная в задачах машинного обучения, значение которой модель должна предсказать на основе входных данных (признаков).
В контексте машинного обучения целевая переменная — сердце задачи: именно ради её предсказания строится и обучается модель. Без целевой переменной невозможно сформулировать задачу обучения с учителем (supervised learning) — ведь именно сопоставление предсказанных значений с реальными формирует сигнал ошибки, на основе которого модель корректирует свои параметры.
Представьте, что вы учите ребёнка угадывать погоду по внешним признакам. Вы показываете ему разные ситуации: «Смотри, небо серое, ветер сильный, птицы летают низко» — и просите сказать, будет ли дождь. Здесь «будет ли дождь» — это целевая переменная, а признаки (цвет неба, сила ветра, поведение птиц) — входные данные. Ребёнок (как модель) учится связывать признаки с целевым значением.
Исторический контекст
Понятие целевой переменной фундаментально для машинного обучения и присутствует в классических работах по статистике и регрессионному анализу, которые легли в основу ML. Уже в линейных моделях начала XX века (например, в работах Карла Пирсона и Рональда Фишера) можно увидеть прообраз целевой переменной как зависимой переменной в уравнении регрессии. С развитием машинного обучения в 1980–1990‑х годах (нейронные сети, деревья решений, SVM) концепция целевой переменной стала ещё более явной и универсальной — она применяется в самых разных типах задач и моделях.
Смежные понятия
- признаки (features) — входные переменные, на основе которых модель предсказывает целевую переменную;
- предсказанное значение (predicted value) — оценка целевой переменной, выданная моделью;
- ошибка (loss, error) — разница между реальным значением целевой переменной и предсказанным.
Важно отличать целевую переменную от признаков: признаки — это «что мы знаем», целевая переменная — «что хотим узнать». Также не стоит путать целевую переменную с метриками качества (accuracy, F1‑score и т. п.) — последние измеряют, насколько хорошо модель предсказывает целевую переменную, но сами ею не являются.
Примеры использования
- В задаче классификации изображений целевая переменная — это метка класса (например, «кошка», «собака», «автомобиль»). Модель (например, CNN — свёрточная нейронная сеть) учится сопоставлять пиксели изображения с этой меткой.
- В задаче регрессии (например, предсказание цены дома) целевая переменная — непрерывное числовое значение (цена). Модели вроде линейной регрессии или градиентного бустинга учатся предсказывать это значение на основе признаков (площадь, количество комнат, район).
- В задаче прогнозирования временных рядов целевая переменная — значение показателя в будущем (например, цена акции через неделю). Модели LSTM или Transformer учатся предсказывать её на основе исторических данных.
- В задаче NLP (обработка естественного языка), например, в классификации тональности текста, целевая переменная — метка тональности («позитивная», «негативная», «нейтральная»). Модели вроде BERT или GPT учатся связывать текст с этой меткой.
