Чувствительность модели (sensitivity)
Метрика в машинном обучении, отражающая способность модели корректно идентифицировать положительные случаи в данных, то есть долю истинно положительных прогнозов среди всех реальных положительных примеров.
Чувствительность (англ. sensitivity), также известная как полнота (англ. recall) или истинно положительная доля (англ. true positive rate, TPR), — один из ключевых показателей качества классификационных моделей. Она особенно важна в задачах, где пропуск положительного случая чреват серьёзными последствиями (например, в медицинской диагностике или системах безопасности).
Представьте, что вы ищете потерянную серёжку в квартире. Чувствительность в этом случае — это доля реально найденных серёжек от общего числа потерянных. Если вы нашли 9 из 10 потерянных серёжек, ваша «чувствительность» составляет 90 %. В контексте нейросетей это означает, что модель правильно распознаёт 90 % положительных случаев.
Исторический контекст
Понятие чувствительности пришло в машинное обучение из медицинской статистики и диагностики, где оно используется для оценки эффективности тестов на заболевания. В контексте ИИ и ML метрика стала широко применяться с развитием классификационных алгоритмов в 1980–1990‑х годах. Она вошла в стандартный набор метрик наряду с точностью (precision), специфичностью (specificity) и F‑мерой (F‑score).
Смежные понятия и различия
- Точность (precision) показывает, какая доля предсказанных положительных случаев действительно является положительной. В отличие от чувствительности, она фокусируется не на всех реальных положительных примерах, а на тех, которые модель посчитала положительными.
- Специфичность (specificity) отражает способность модели корректно идентифицировать отрицательные случаи — долю истинно отрицательных прогнозов среди всех реальных отрицательных примеров.
- F‑мера (F‑score) — гармоническое среднее между точностью и чувствительностью, позволяющее сбалансировать их вклад в общую оценку качества модели.
Чувствительность и точность часто находятся в компромиссе: повышение одной метрики может вести к снижению другой. Выбор приоритетной метрики зависит от задачи — например, в медицинской диагностике важнее высокая чувствительность, чтобы не пропустить заболевание, тогда как в спам‑фильтрах важнее точность, чтобы не отсеять важные письма.
Примеры использования
- В медицинской диагностике чувствительность модели критически важна для выявления заболеваний (например, рака на ранних стадиях). Модель с высокой чувствительностью минимизирует риск ложноотрицательных прогнозов, когда болезнь есть, но модель её не обнаружила.
- В системах обнаружения мошенничества чувствительность помогает выявлять подозрительные транзакции. Здесь важно не пропустить мошеннические операции, даже если это приведёт к некоторому увеличению ложных срабатываний.
- В компьютерном зрении чувствительность используется для оценки качества моделей обнаружения объектов (например, пешеходов на дороге для автономных автомобилей).
Популярные реализации и модели
Чувствительность играет ключевую роль в следующих реализациях и моделях:
- модели глубокого обучения для медицинской визуализации (например, CNN для анализа рентгеновских снимков);
- алгоритмы детекции аномалий в финансовых транзакциях;
- системы распознавания лиц и объектов, где важно минимизировать пропуски целевых объектов.
