Целевая переменная (Target Variable)

Что такое Целевая переменная (Target Variable)?

Целевая переменная — это переменная в задачах машинного обучения, значение которой модель должна предсказать на основе входных данных (признаков).

В контексте машинного обучения целевая переменная — сердце задачи: именно ради её предсказания строится и обучается модель. Без целевой переменной невозможно сформулировать задачу обучения с учителем (supervised learning) — ведь именно сопоставление предсказанных значений с реальными формирует сигнал ошибки, на основе которого модель корректирует свои параметры.

Представьте, что вы учите ребёнка угадывать погоду по внешним признакам. Вы показываете ему разные ситуации: «Смотри, небо серое, ветер сильный, птицы летают низко» — и просите сказать, будет ли дождь. Здесь «будет ли дождь» — это целевая переменная, а признаки (цвет неба, сила ветра, поведение птиц) — входные данные. Ребёнок (как модель) учится связывать признаки с целевым значением.

Исторический контекст

Понятие целевой переменной фундаментально для машинного обучения и присутствует в классических работах по статистике и регрессионному анализу, которые легли в основу ML. Уже в линейных моделях начала XX века (например, в работах Карла Пирсона и Рональда Фишера) можно увидеть прообраз целевой переменной как зависимой переменной в уравнении регрессии. С развитием машинного обучения в 1980–1990‑х годах (нейронные сети, деревья решений, SVM) концепция целевой переменной стала ещё более явной и универсальной — она применяется в самых разных типах задач и моделях.

Смежные понятия

  • признаки (features) — входные переменные, на основе которых модель предсказывает целевую переменную;
  • предсказанное значение (predicted value) — оценка целевой переменной, выданная моделью;
  • ошибка (loss, error) — разница между реальным значением целевой переменной и предсказанным.

Важно отличать целевую переменную от признаков: признаки — это «что мы знаем», целевая переменная — «что хотим узнать». Также не стоит путать целевую переменную с метриками качества (accuracy, F1‑score и т. п.) — последние измеряют, насколько хорошо модель предсказывает целевую переменную, но сами ею не являются.

Примеры использования

  • В задаче классификации изображений целевая переменная — это метка класса (например, «кошка», «собака», «автомобиль»). Модель (например, CNN — свёрточная нейронная сеть) учится сопоставлять пиксели изображения с этой меткой.
  • В задаче регрессии (например, предсказание цены дома) целевая переменная — непрерывное числовое значение (цена). Модели вроде линейной регрессии или градиентного бустинга учатся предсказывать это значение на основе признаков (площадь, количество комнат, район).
  • В задаче прогнозирования временных рядов целевая переменная — значение показателя в будущем (например, цена акции через неделю). Модели LSTM или Transformer учатся предсказывать её на основе исторических данных.
  • В задаче NLP (обработка естественного языка), например, в классификации тональности текста, целевая переменная — метка тональности («позитивная», «негативная», «нейтральная»). Модели вроде BERT или GPT учатся связывать текст с этой меткой.

Авторизация