Конволюционная нейронная сеть (CNN) (Convolutional Neural Network, CNN)
Конволюционная нейронная сеть (CNN) — это тип нейронной сети, специально разработанный для обработки и анализа данных с пространственной структурой, например, изображений или видео.
CNN широко применяются в задачах компьютерного зрения: распознавании объектов, классификации изображений, обнаружении лиц и других визуальных задачах. Их уникальность заключается в использовании операций свёртки, которые позволяют сети эффективно извлекать локальные признаки из входных данных.
Представьте себе, что вы рассматриваете картину через увеличительное стекло — вы фокусируетесь на небольших участках изображения и анализируете их детали. Точно так же CNN «рассматривает» изображение, анализируя небольшие фрагменты и выявляя в них важные признаки, такие как края, углы или текстуры.
История развития CNN тесно связана с именем Яна Лекуна — учёного, который в 1988 году представил одну из первых успешных архитектур конволюционных нейронных сетей. С тех пор CNN претерпели значительные изменения и улучшения, став основой для множества современных систем компьютерного зрения.
В отличие от других типов нейронных сетей, например, полносвязных сетей, CNN обладают несколькими ключевыми особенностями:
- использование операций свёртки для извлечения локальных признаков;
- применение операций пулинга (subsampling) для уменьшения размерности данных и повышения инвариантности к масштабу и положению объектов;
- иерархическая структура, позволяющая сети постепенно извлекать всё более сложные и абстрактные признаки.
Примеры использования CNN:
- системы автоматического распознавания номерных знаков на автомобилях;
- алгоритмы для диагностики заболеваний по медицинским изображениям (например, обнаружение опухолей на рентгеновских снимках);
- приложения для распознавания лиц и эмоций в системах безопасности и социальных сетях;
- системы автономного вождения, где CNN помогают автомобилям «видеть» и интерпретировать окружающую обстановку;
- программы для классификации и поиска изображений в больших базах данных.
