Входной слой (Input Layer)
Первый слой нейронной сети, который принимает исходные данные для обработки и передаёт их далее по архитектуре модели.
Представьте входной слой как приёмную стойку в отеле: именно сюда в первую очередь обращается гость (в нашем случае — входные данные), чтобы начать процесс обслуживания. Сотрудник стойки (нейроны входного слоя) фиксирует информацию (например, имя, номер бронирования) и передаёт её дальше по цепочке — в службы отеля (следующие слои сети), которые займутся непосредственным решением задачи (размещением гостя, организацией питания и т. д.).
История и развитие
Исторически структура нейронных сетей с явным выделением входного, скрытых и выходного слоёв оформилась с развитием многослойных перцептронов (Multilayer Perceptron, MLP) в 1980‑х годах. Концепция перцептрона была предложена Фрэнком Розенблаттом ещё в 1950‑х, но именно с появлением алгоритмов обратного распространения ошибки (backpropagation) стало возможным эффективно обучать сети с несколькими слоями. Входной слой при этом остался «точкой входа» для данных — без какой‑либо трансформации или обучения весов: его задача — корректно передать информацию дальше.
Отличия входного слоя от скрытых слоёв
Важно отличать входной слой от следующих за ним скрытых слоёв:
- Входной слой не выполняет вычислений и не имеет настраиваемых параметров (весов и смещений). Он лишь принимает и распределяет данные.
- Скрытые слои уже проводят математические операции (умножение на веса, добавление смещений, применение функций активации) и обучаются в процессе тренировки модели.
Примеры использования
- В свёрточных нейронных сетях (CNN) для обработки изображений входной слой принимает трёхмерный массив пикселей (высота × ширина × каналы, например, RGB).
- В рекуррентных сетях (RNN) для работы с текстами или временными рядами входной слой получает последовательность векторов (например, эмбеддинги слов).
- В простых полносвязных сетях (MLP) входной слой может принимать плоский вектор признаков (например, числовые характеристики объекта в задаче классификации).
Реализация во фреймворках
Популярные фреймворки (TensorFlow, PyTorch) автоматически создают входной слой при определении архитектуры сети — достаточно указать форму входных данных (input shape).
