Цифровое представление (Digital Representation)
Способ кодирования информации (данных, сигналов, образов) в дискретной, числовой форме, пригодной для обработки алгоритмами машинного обучения и нейронными сетями.
В контексте ИИ и машинного обучения цифровое представление лежит в основе всего процесса: нейросети не работают с «сырыми» аналоговыми данными (например, со звуком в воздухе или светом, попадающим в глаз), им нужны чётко структурированные числовые массивы. Любая информация — изображения, текст, аудио, временные ряды — должна быть преобразована в векторы, матрицы или тензоры чисел, с которыми модель сможет оперировать: умножать, складывать, сравнивать, оптимизировать.
Аналогия из бытового мира
Представьте, что вы хотите передать другу рецепт пирога. Вместо того чтобы принести готовый пирог, вы записываете ингредиенты и шаги в виде списка чисел и инструкций: «200 г муки», «170 °C», «выпекать 40 мин». Это и есть «цифровое представление» рецепта: не сам объект, а его точная числовая модель, по которой можно воспроизвести оригинал. Точно так же нейросеть «видит» не картинку, а матрицу чисел (пикселей), и по этим числам восстанавливает смысл.
Исторический контекст
Идея цифрового представления восходит к основам вычислительной техники (фон Нейман, 1940‑е) и теории информации (Клод Шеннон, 1948). В контексте нейросетей ключевой шаг сделан в 1980–1990‑е:
- появление свёрточных сетей (LeNet, Yann LeCun, 1989) потребовало строгого представления изображений как матриц пикселей;
- развитие NLP (например, Word2Vec, 2013) показало, как тексты можно переводить в векторы чисел (эмбеддинги);
- современные трансформеры (BERT, GPT) опираются на сложные цифровые представления текста, включая позиционные кодировки и многомерные тензоры.
Смежные понятия и отличия
- Аналоговое представление — непрерывные сигналы (например, напряжение в нейронной схеме). В ИИ почти не используется, так как плохо совместимо с цифровыми вычислениями.
- Символьное представление — данные как символы/строки (например, логические правила). В отличие от цифрового, не предполагает числовой обработки; в современном ML уступает место числовым эмбеддингам.
- Векторное представление (эмбеддинг) — частный случай цифрового представления, где объекты (слова, изображения) кодируются векторами в непрерывном пространстве.
Примеры использования
- Изображения: пиксели как матрицы чисел (например, 28×28 для MNIST), нормализованные в диапазон [0, 1] или [−1, 1].
- Текст:
- one-hot-кодирование слов;
- Word2Vec, GloVe — векторы размерности 100–300;
- BERT — контекстные эмбеддинги (тензоры 768×длина последовательности).
- Аудио: спектрограммы (матрицы амплитуд частот во времени), мел-спектрограммы.
- Временные ряды: последовательности чисел (например, цены акций), часто с нормализацией и оконным разбиением.
- Графы: матрицы смежности, эмбеддинги узлов (Graph Neural Networks).
