Elloe AI: «иммунная система» для искусственного интеллекта
Оуэн Сакава, основатель Elloe AI, хочет, чтобы его платформа стала «иммунной системой для ИИ» и «антивирусом для любого ИИ-агента».
По словам Сакавы, идея заключается в том, чтобы добавить к LLM компаний слой, который будет проверять ответы на наличие предвзятости, «галлюцинаций», ошибок, проблем с соответствием требованиям, дезинформации и небезопасных данных. Он высказал эту мысль в интервью за несколько дней до конференции TechCrunch Disrupt, где Elloe AI вошла в число 20 финалистов конкурса Startup Battlefield.
«ИИ развивается очень быстро, и он движется с такой скоростью без каких-либо ограничителей, без систем безопасности, без механизмов, которые могли бы предотвратить его выход из-под контроля», — сказал Сакава.
Elloe AI — это API или SDK, модуль, который размещается поверх выходного слоя ИИ-модели, «инфраструктура поверх вашего LLM-пайплайна», как объяснил Сакава. «Он находится там и фактически проверяет на достоверность каждый ответ», — добавил он.
Система стартапа имеет несколько уровней, или «якорей», как их называет Сакава:
- первый «якорь» сверяет ответ LLM с проверяемыми источниками;
- второй «якорь» проверяет, не нарушает ли вывод какие-либо правила, например закон США о конфиденциальности медицинских данных HIPAA или европейский закон о защите данных и конфиденциальности GDPR, а также не раскрывает ли он личную информацию;
- последний «якорь» — это аудиторский след, который показывает, как были приняты все предыдущие решения, и позволяет регулирующим органам или любому, кто проводит аудит системы, «проанализировать ход рассуждений модели, источник решения и уровень уверенности в каждом из них», — говорит Сакава.
Сакава подчёркивает, что Elloe AI не построен на базе LLM, поскольку, по его мнению, проверка одних LLM другими — это лишь «наклейка пластыря на другую рану». При этом в системе Elloe AI используются методы ИИ, например машинное обучение. Также в процессе участвуют люди: сотрудники Elloe AI, которые следят за новыми правилами в области защиты данных и пользователей.
