Apple опубликовала три исследовательские работы в области ИИ для программирования

Компания Apple опубликовала три исследовательские работы в области применения искусственного интеллекта для программирования. Учёные предложили новые подходы для поиска ошибок в коде, тестирования программных решений и обучения моделей, способных создавать работающий код.

Исследование ADE-QVAET

Первое исследование посвящено модели под названием ADE-QVAET. Она решает проблемы, с которыми сталкиваются современные ИИ-модели: галлюцинации, потерю контекста при анализе больших объёмов кода и утрату связи с бизнес-логикой программы. Система объединяет четыре метода: адаптивную дифференциальную эволюцию, квантовый вариационный автокодировщик, архитектуру трансформера и адаптивное шумоподавление.

В отличие от обычных языковых моделей, ADE-QVAET не анализирует код напрямую. Она оценивает его сложность, размер и структуру, ища закономерности, которые могут указывать на вероятные ошибки. Тесты показали точность прогнозов от 95 % до 98 %, что говорит о высокой надёжности модели и минимальном количестве ложных срабатываний.

Система Agentic RAG

Второе исследование посвящено планированию и созданию инструментов для тестирования крупных программных проектов. Учёные разработали систему Agentic RAG, которая самостоятельно планирует, пишет и организует тестирование ПО. По словам авторов, эти задачи обычно занимают у инженеров по качеству от 30 % до 40 % рабочего времени.

Подключение нескольких ИИ-агентов к модели с RAG повысило точность тестирования с 65 % до 94,8 %. Время тестирования сократилось на 85 %, точность средств проверки выросла также на 85 %, а прогнозируемая экономия составила 35 %. Система позволила сократить сроки ввода программ в эксплуатацию на два месяца. Единственное ограничение: её тестировали только на корпоративных кадровых и бухгалтерских системах, а также решениях SAP.

Проект SWE-Gym

Третий проект получил название SWE-Gym. Это механизм обучения ИИ-агентов на основе чтения, редактирования и проверки реального программного кода. Платформа построена на 2438 задачах на языке Python из 11 открытых репозиториев. Благодаря исполняемой среде и набору тестов агенты могли практиковаться в написании и отладке кода в реалистичных условиях.

Авторы также создали упрощённую версию — SWE-Gym Lite на базе 230 более простых задач. Она помогает ускорить обучение и снизить затраты на вычисления.

Агенты, обученные с помощью SWE-Gym, правильно решили 72,5 % предложенных задач, что на 20 процентных пунктов выше по сравнению с предыдущими методами. На платформе SWE-Gym Lite время обучения сокращается вдвое, но такие агенты подходят только для более простых задач.

Источник: mltimes.ai

Apple опубликовала три исследовательские работы в области ИИ для программирования

Исследование ADE-QVAET

Система Agentic RAG

Проект SWE-Gym

Авторизация