Цифровое преобразование (Digital Conversion)
процесс перевода аналоговых данных или сигналов в цифровую форму, пригодную для обработки алгоритмами машинного обучения и нейронными сетями
В контексте ИИ и машинного обучения цифровое преобразование выступает как обязательный предварительный этап работы с «реальными» данными — изображениями, звуком, показаниями датчиков и т. п. Без него невозможно подать информацию на вход модели: нейронные сети оперируют только числовыми тензорами, а не непрерывными сигналами или физическими величинами.
Аналогия
Представьте, что вы хотите отправить другу рисунок, но можете пользоваться только текстовым мессенджером. Вы не пересылаете сам лист бумаги, а описываете его словами: «большой красный круг, сверху маленький синий треугольник». Это и есть преобразование аналогового объекта (рисунок) в цифровую/символическую форму (текст). Нейросети работают с ещё более формализованным «языком» — массивами чисел.
Исторический контекст
Идея дискретизации непрерывных сигналов восходит к теореме Котельникова (1933), заложившей основы цифровой обработки сигналов. В контексте ИИ массовое цифровое преобразование стало критически важным с ростом задач компьютерного зрения и распознавания речи в 1980–1990‑х. Например, для обучения первых свёрточных сетей (LeNet, 1998) изображения обязательно преобразовывались в матрицы пикселей. Сегодня цифровые сенсоры (камеры, микрофоны, IoT‑датчики) зачастую выдают уже оцифрованные данные, но предобработка и нормализация всё равно остаются частью «цифрового преобразования» в пайплайне ML.
Смежные понятия
- Оцифровка — более общий термин, часто используемый в архивировании и мультимедиа; в ML подразумевает именно подготовку данных для моделей.
- Предобработка (preprocessing) — включает цифровое преобразование как один из шагов, но также охватывает нормализацию, аугментацию и т. д.
- Квантование (quantization) — частный случай цифрового преобразования, когда непрерывные значения округляются до конечного набора уровней (например, 8‑битные пиксели).
Примеры использования
- Преобразование аналогового аудиосигнала в спектрограмму (STFT) для подачи на вход модели распознавания речи (например, Wav2Vec, Whisper).
- Перевод аналоговой плёнки в цифровые кадры с последующей нормализацией яркости/контраста для обучения моделей компьютерного зрения.
- Оцифровка показаний аналоговых датчиков (температура, давление) в временные ряды для прогнозирования с помощью LSTM или Transformers.
- Квантование весов нейронной сети (например, INT8) — разновидность цифрового преобразования, ускоряющая инференс на edge‑устройствах.
