Alibaba выпустила открытую модель Z-Image для генерации фотореалистичных изображений

Alibaba выпустила Z-Image — открытую модель для генерации фотореалистичных изображений

Компания Alibaba представила модель Z-Image, предназначенную для генерации фотореалистичных изображений. По заявлениям разработчиков, качество результатов сопоставимо с уровнем Flux 2. Демоверсия модели доступна бесплатно на платформе HuggingFace.

Главная особенность Z-Image — компактный размер при высоком качестве. Модель содержит всего 6 миллиардов параметров, в то время как Flux 2 использует 32 миллиарда параметров (более чем в пять раз больше).

Возможности системы

Разработчики отмечают следующие возможности нейросети:

  • воспроизведение достопримечательностей и видов городов мира по текстовому запросу;
  • понимание описаний на разных языках и создание соответствующих изображений;
  • рендеринг текста на английском и китайском языках.

Модель также обучали русскому, немецкому, французскому и испанскому языкам, однако на этих языках Z-Image пока допускает ошибки — требуется дополнительное обучение для улучшения качества.

Варианты доступности модели

Z-Image доступна в нескольких вариантах:

  • бесплатная демоверсия — можно попробовать на HuggingFace прямо в браузере;
  • версия Z-Image Turbo — код и веса выложены на трёх платформах: GitHub, HuggingFace и ModelScope.

Технические требования и преимущества

Одно из важных преимуществ модели — низкие требования к оборудованию. Для работы Z-Image Turbo подойдут видеокарты с 16 ГБ видеопамяти, что делает модель доступной для широкого круга пользователей (многие современные игровые карты имеют такой объём памяти).

Планы компании

Alibaba планирует расширить линейку моделей:

  • Z-Image Edit — версия, предназначенная для редактирования готовых изображений (будет опубликована позже);
  • улучшенная версия Z-Image Base — будет более «тяжёлой», но обеспечит лучшее качество результатов.

Значение выхода Z-Image

Выход Z-Image усиливает конкуренцию на рынке генеративных моделей для изображений. Китайские компании активно развивают собственные решения в области ИИ. Открытая лицензия позволяет разработчикам использовать модель в своих проектах без ограничений.

Компактный размер модели открывает новые возможности: генерация изображений становится доступной на менее мощном оборудовании. Это может ускорить внедрение технологий ИИ в различных приложениях и сервисах.

Источник: mltimes.ai

Авторизация