Исследователи MIT разработали новый подход к байесовской оптимизации с использованием табличных фундаментальных моделей
Новый подход к решению инженерных задач
Многие инженерные задачи осложняются обилием переменных и ограниченными возможностями их тестирования. Например, при проектировании безопасной конструкции автомобиля инженерам приходится учитывать тысячи деталей, а каждая оценка может быть дорогостоящей.
Исследователи из MIT разработали новый подход к байесовской оптимизации, который позволяет эффективно решать задачи с сотнями переменных. В тестах на реальных инженерных задачах (например, оптимизация энергосистемы) метод находил оптимальные решения в 10–100 раз быстрее по сравнению с широко используемыми методами.
Как работает технология
В основе подхода — табличная фундаментальная модель, обученная на табличных данных. Она автоматически определяет наиболее значимые переменные для улучшения производительности, повторяя процесс для поиска всё более оптимальных решений.
Ключевые преимущества:
- не требует постоянного переобучения в процессе поиска решения;
- обеспечивает большее ускорение для сложных задач;
- может быть особенно полезна в таких областях, как разработка материалов или поиск лекарств.
Преодоление ограничений байесовской оптимизации
Традиционная байесовская оптимизация использует суррогатную модель, которую необходимо переобучать после каждой итерации. Это становится вычислительно неосуществимым при большом пространстве потенциальных решений. Кроме того, для каждого нового сценария требуется создавать модель с нуля.
Исследователи MIT использовали генеративную ИИ-систему (табличную фундаментальную модель) в качестве суррогатной модели внутри алгоритма байесовской оптимизации. По словам Розен Ю, аспиранта в области вычислительных наук и инженерии и ведущего автора статьи о данной методике, табличная фундаментальная модель — это «ChatGPT для электронных таблиц».
Тестирование и результаты
Исследователи протестировали свой метод, сравнив его с пятью современными алгоритмами оптимизации на 60 тестовых задачах, включая проектирование энергосетей и краш-тесты автомобилей. Их метод постоянно находил лучшее решение в 10–100 раз быстрее других алгоритмов.
Однако метод не превзошёл базовые показатели во всех задачах — например, при планировании пути робота. Вероятно, это связано с тем, что данный сценарий не был хорошо представлен в обучающих данных модели.
Перспективы развития
В будущем исследователи планируют:
- изучить методы, которые могли бы повысить производительность табличных фундаментальных моделей;
- применить свою методику к задачам с тысячами или даже миллионами измерений (например, проектирование военного корабля).
«На более высоком уровне эта работа указывает на более широкий сдвиг: использование фундаментальных моделей не только для восприятия или языка, но и в качестве алгоритмических движков внутри научных и инженерных инструментов», — отмечает Фаез Ахмед, доцент кафедры машиностроения и ключевой сотрудник Центра вычислительных наук и инженерии MIT.
