Multiverse Computing представляет сжатые AI-модели для локального использования
Сжатые AI-модели: шаг к независимости от облачных сервисов
На фоне финансовой нестабильности в цепочке поставок AI-технологий венчурная фирма Lux Capital рекомендует компаниям, использующим искусственный интеллект, подтверждать обязательства по вычислительным мощностям в письменном виде. В качестве альтернативы предлагается отказаться от внешней вычислительной инфраструктуры вовсе — благодаря появлению небольших AI-моделей, способных работать непосредственно на устройстве пользователя.
Испанский стартап Multiverse Computing активно развивает это направление. Компания сжала модели ведущих AI-лабораторий (OpenAI, Meta, DeepSeek, Mistral AI) и запустила:
- приложение CompactifAI — чат-инструмент на базе AI, аналогичный ChatGPT или Le Chat от Mistral;
- API-портал — шлюз, позволяющий разработчикам получать доступ к сжатым моделям и использовать их в своих проектах.
Как работает CompactifAI
В приложении CompactifAI используется модель Gilda — настолько компактная, что может работать локально и в офлайн-режиме. Это даёт пользователям возможность использовать AI без передачи данных на внешние серверы. Однако есть ограничение: мобильное устройство должно обладать достаточным объёмом оперативной памяти и хранилища.
Если ресурсы устройства недостаточны (например, у многих старых iPhone), приложение автоматически переключается на облачные модели через API. Переключение между локальной и облачной обработкой данных осуществляется системой Ash Nazg (название отсылает к «Властелину колец» Дж. Р. Р. Толкина).
Целевая аудитория и преимущества
Хотя приложение CompactifAI пока не готово к массовому внедрению (за последний месяц оно было скачано менее 5 000 раз), его основная цель — привлечение бизнеса. Запуск самообслуживаемого API-портала даёт разработчикам и предприятиям прямой доступ к сжатым моделям без необходимости использования AWS Marketplace.
Ключевые преимущества сжатых моделей:
- снижение затрат на вычисления;
- повышенная конфиденциальность (данные не покидают устройство);
- устойчивость к сбоям связи (важно для дронов, спутников и других устройств, где подключение к сети не гарантировано).
Последние достижения и планы
Последняя сжатая модель Multiverse Computing — HyperNova 60B 2602, основанная на модели OpenAI gpt-oss-120b. Компания утверждает, что она обеспечивает более быстрые ответы при меньших затратах по сравнению с исходной моделью.
На данный момент Multiverse Computing обслуживает более 100 глобальных клиентов, включая Банк Канады, Bosch и Iberdrola. После привлечения 215 миллионов долларов в рамках раунда Series B в прошлом году, компания, по слухам, планирует привлечь ещё 500 миллионов евро при оценке более чем в 1,5 миллиарда евро.
«API-портал CompactifAI теперь даёт разработчикам прямой доступ к сжатым моделям с прозрачностью и контролем, необходимыми для их использования в продакшене», — заявил генеральный директор Энрике Лизасо.
