Бинарная классификация (Binary Classification)
Бинарная классификация — это задача машинного обучения, в которой модель должна отнести каждый входной объект к одному из двух взаимоисключающих классов.
В контексте ИИ и ML бинарная классификация — один из базовых и наиболее распространённых типов задач обучения с учителем. Модель обучается на размеченных данных, где каждому примеру сопоставлена метка одного из двух классов (часто обозначаемых как «0» и «1», «отрицательный» и «положительный», «нет» и «да»). Цель алгоритма — выявить закономерности в признаках объектов, позволяющие с максимальной точностью предсказывать класс новых, ранее не встречавшихся примеров.
Аналогия из бытового мира
Представьте, что вы сортируете почту: нужно разложить письма по двум ящикам — «важно» и «не важно». Вы смотрите на отправителя, тему, первые строки — и на основе этих признаков принимаете решение. Бинарная классификация в ML работает похоже: модель «смотрит» на признаки объекта и «кладёт» его в один из двух классов.
Исторический контекст
Задачи бинарной классификации решались ещё до появления современных нейронных сетей — например, с помощью логистической регрессии, метода опорных векторов (SVM) и деревьев решений. С развитием глубокого обучения для бинарной классификации стали активно применять нейронные сети, в том числе свёрточные (CNN) для изображений и рекуррентные (RNN) для последовательностей. Важную роль в популяризации и развитии методов бинарной классификации сыграли крупные датасеты (например, MNIST для распознавания цифр, ImageNet для классификации изображений), а также соревнования вроде Kaggle, где такие задачи часто выступают в качестве базовых бенчмарков.
Смежные понятия
Бинарную классификацию следует отличать от:
- многоклассовой классификации (multiclass classification), где объектов нужно отнести к одному из более чем двух классов;
- мультилабельной классификации (multilabel classification), где каждый объект может принадлежать одновременно к нескольким классам.
Примеры использования
- Спам‑фильтрация в электронной почте: модель определяет, является ли письмо спамом («1») или нет («0»).
- Диагностика заболеваний по медицинским изображениям: модель классифицирует снимок как «патологический» («1») или «нормальный» («0»).
- Кредитный скоринг: модель предсказывает, вернёт ли заёмщик кредит («0» — вернёт, «1» — не вернёт).
- Анализ тональности текстов (sentiment analysis): модель определяет, является ли отзыв положительным («1») или отрицательным («0»).
Популярные модели и архитектуры для бинарной классификации
- логистическая регрессия;
- метод опорных векторов (SVM);
- случайные леса (Random Forest);
- градиентный бустинг (XGBoost, LightGBM);
- нейронные сети (в том числе полносвязные, CNN, RNN, трансформеры).
