Ширина рецептивного поля (Receptive Field Size)
Ширина рецептивного поля — это размер области входного пространства (например, изображения), которая влияет на активацию конкретного нейрона в свёрточной нейронной сети или на значение элемента в карте признаков.
Представьте, что вы смотрите на картину через маленькое окошко — то, что вы видите в этом окошке, и есть ваше «рецептивное поле». Если окошко маленькое, вы различаете лишь мелкие детали; если большое — охватываете больше пространства, но теряете детализацию. В свёрточных сетях рецептивное поле определяет, какую часть исходного изображения «видит» конкретный нейрон при вычислении своего выходного значения.
Исторический контекст
Исторически концепция рецептивного поля пришла из нейробиологии: в 1950‑х годах Дэвид Хьюбел и Торстен Визель изучали зрительную кору кошек и обнаружили, что отдельные нейроны реагируют на стимулы в определённых областях зрительного поля. Эти открытия легли в основу понимания иерархической обработки визуальной информации, что позже было экстраполировано на архитектуру искусственных нейронных сетей. В контексте свёрточных сетей (CNN) идея рецептивного поля стала ключевой для проектирования слоёв свёртки и пулинга, позволяющих сети постепенно улавливать всё более сложные и абстрактные признаки.
Отличия от связанных понятий
Важно отличать ширину рецептивного поля от других связанных понятий:
- Размер ядра свёртки — это лишь один из факторов, определяющих ширину рецептивного поля. Помимо размера ядра, на ширину влияют количество слоёв, шаг свёртки (stride) и наличие пулинга.
- Карта признаков — это результат применения свёртки, а рецептивное поле описывает, какая часть входа влияет на каждый элемент этой карты.
Примеры использования
- В архитектуре VGGNet постепенное увеличение глубины сети приводит к росту ширины рецептивного поля, позволяя сети улавливать всё более глобальные паттерны.
- В ResNet остаточные соединения не меняют напрямую ширину рецептивного поля, но позволяют строить очень глубокие сети, где рецептивное поле охватывает практически всё входное изображение.
- При детекции объектов (например, в YOLO или Faster R‑CNN) ширина рецептивного поля критически важна: слишком маленькая — сеть не увидит объект целиком; слишком большая — потеряет точность локализации мелких деталей.
- В задачах семантической сегментации (например, U‑Net) тщательно подбирают параметры свёрточных слоёв, чтобы рецептивное поле соответствовало масштабу объектов на изображении.
