Искусственный интеллект обучили распознаванию древнеегипетских иероглифов

Учёные из Института искусственного интеллекта AIRI совместно с коллегами разработали уникальную систему, способную с высокой точностью распознавать и переводить древнеегипетские иероглифы.

Для обучения модели использовалась база данных Thesaurus Linguae Aegyptiae — наиболее полное собрание древнеегипетских текстов с переводами. Сначала применялись автоматические метрики оценки качества перевода, затем результаты проверили профессиональные египтологи из НИУ ВШЭ, сообщается на сайте Российской академии наук.

Распознавание иероглифов — сложная задача, так как вместо стандартного алфавита из 30–40 букв система должна интерпретировать сотни уникальных символов, каждый из которых имеет своё значение.

Чтобы повысить точность распознавания, учёные использовали контекстуально-зависимые OCR-модели и диффузионные модели, способные генерировать реалистичные изображения для расширения обучающего набора.

Проект направлен на разработку новых технологий распознавания рукописных текстов, которые важны для создания и обогащения крупных языковых моделей в условиях нехватки данных.

Разработчики утверждают, что в будущем подобные технологии могут быть интегрированы в мобильные приложения дополненной реальности. Это позволит посетителям музеев направлять камеры смартфонов на экспонаты с иероглифами и мгновенно получать переводы надписей. Также эти технологии могут упростить обучение студентов-египтологов.

«Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвящённую разработке метода, мы уже представили на международной конференции SIGGRAPH 2025. На данный момент доступ к системе открыт по запросу для заинтересованных специалистов», — заключает руководитель проекта, ведущий научный сотрудник ИСП РАН и AIRI, доцент ИТМО Илья Макаров.

Источник: hi-tech.mail.ru

Авторизация