Elloe AI: «иммунная система» для искусственного интеллекта

Оуэн Сакава, основатель Elloe AI, хочет, чтобы его платформа стала «иммунной системой для ИИ» и «антивирусом для любого ИИ-агента».

По словам Сакавы, идея заключается в том, чтобы добавить к LLM компаний слой, который будет проверять ответы на наличие предвзятости, «галлюцинаций», ошибок, проблем с соответствием требованиям, дезинформации и небезопасных данных. Он высказал эту мысль в интервью за несколько дней до конференции TechCrunch Disrupt, где Elloe AI вошла в число 20 финалистов конкурса Startup Battlefield.

«ИИ развивается очень быстро, и он движется с такой скоростью без каких-либо ограничителей, без систем безопасности, без механизмов, которые могли бы предотвратить его выход из-под контроля», — сказал Сакава.

Elloe AI — это API или SDK, модуль, который размещается поверх выходного слоя ИИ-модели, «инфраструктура поверх вашего LLM-пайплайна», как объяснил Сакава. «Он находится там и фактически проверяет на достоверность каждый ответ», — добавил он.

Система стартапа имеет несколько уровней, или «якорей», как их называет Сакава:

  1. первый «якорь» сверяет ответ LLM с проверяемыми источниками;
  2. второй «якорь» проверяет, не нарушает ли вывод какие-либо правила, например закон США о конфиденциальности медицинских данных HIPAA или европейский закон о защите данных и конфиденциальности GDPR, а также не раскрывает ли он личную информацию;
  3. последний «якорь» — это аудиторский след, который показывает, как были приняты все предыдущие решения, и позволяет регулирующим органам или любому, кто проводит аудит системы, «проанализировать ход рассуждений модели, источник решения и уровень уверенности в каждом из них», — говорит Сакава.

Сакава подчёркивает, что Elloe AI не построен на базе LLM, поскольку, по его мнению, проверка одних LLM другими — это лишь «наклейка пластыря на другую рану». При этом в системе Elloe AI используются методы ИИ, например машинное обучение. Также в процессе участвуют люди: сотрудники Elloe AI, которые следят за новыми правилами в области защиты данных и пользователей.

Источник: techcrunch.com

Авторизация