Зона чувствительности модели (Sensitivity Zone of a Model)
Что такое Зона чувствительности модели (Sensitivity Zone of a Model)?
Область в пространстве входных данных, в пределах которой небольшие изменения аргументов приводят к существенным изменениям выходных значений модели машинного обучения.
- Области обобщения — там модель стабильно выдаёт корректные предсказания на новых данных; чувствительность, напротив, сигнализирует о нестабильности.
- Точек перегиба в математическом анализе — хотя формально это схожие понятия, в ML акцент делается не на аналитических свойствах функции, а на практическом поведении модели при реальных данных и шумах.
- Переобучения (overfitting) — переобучение означает плохую обобщающую способность на всём наборе данных, тогда как чувствительность может проявляться локально, даже в хорошо обученной модели.
- В компьютерном зрении зоны чувствительности выявляют, добавляя к изображениям малозаметные возмущения (например, с помощью метода Fast Gradient Sign Method, FGSM).
Модель, которая на чистом изображении уверенно распознаёт «кошку», может на возмущённом варианте внезапно выдать «собаку».
- В обработке естественного языка аналогичные атаки меняют отдельные слова или символы, заставляя модель менять классификацию текста.
- В безопасности ML анализ зон чувствительности помогает оценивать устойчивость моделей к состязательным атакам и разрабатывать методы робастного обучения (adversarial training), где модель «тренируют» на возмущённых примерах, чтобы снизить её уязвимость.
