Входные данные (Input Data)
Информация, подаваемая на вход нейронной сети или модели машинного обучения для обработки, анализа или обучения.
Аналогия
Представьте шеф‑повара, который готовит блюдо. Входные данные — это ингредиенты, которые он получает: овощи, мясо, специи. От их качества, свежести и сочетания зависит, каким получится блюдо. Так и для нейросети: качество и релевантность входных данных напрямую влияют на качество её работы.
Исторический контекст
Понятие входных данных фундаментально для всего машинного обучения и существовало с момента зарождения области. Уже в перцептроне Фрэнка Розенблатта (1957–1958) были чётко выделены входные сигналы (input signals), подаваемые на входные нейроны. С развитием моделей и задач типы и объёмы входных данных многократно расширялись: от простых векторов признаков в классических алгоритмах до многомерных тензоров в глубоких сетях (изображения, видео, текст, аудио).
Смежные понятия
- Выходные данные (output) — результат работы модели, то, что она выдаёт после обработки входных данных.
- Промежуточные представления (hidden representations) — внутренние активации слоёв сети, возникающие в процессе преобразования входных данных.
- Метки (labels) — «правильные ответы», с которыми модель сравнивает свои выходные данные при обучении с учителем.
Важно не путать входные данные с гиперпараметрами: первые — это информация для обработки, вторые — настройки самой модели (например, скорость обучения, количество слоёв), задаваемые до начала обучения.
Примеры использования
- В свёрточных нейронных сетях (CNN) входные данные — это изображения, представленные в виде трёхмерных тензоров (высота × ширина × каналы).
- В рекуррентных сетях (RNN) и трансформерах входные данные — последовательности токенов (например, слова в тексте, закодированные в векторы).
- В задачах табличных данных входные данные — матрицы признаков, где строки — объекты, а столбцы — их характеристики.
- В генеративных моделях (например, GAN) входные данные для генератора могут быть случайными шумами (latent vectors), а для дискриминатора — реальные и сгенерированные образцы.
Популярные форматы и источники входных данных
- Изображения: JPEG, PNG, загружаемые из датасетов вроде ImageNet, COCO.
- Текст: JSONL, CSV с текстами, токенизированными с помощью BPE, WordPiece и т. п.
- Табличные данные: CSV, Parquet, полученные из баз данных или API.
- Аудио: WAV, MP3, из датасетов вроде LibriSpeech.
