Alibaba выпустила открытую модель Z-Image для генерации фотореалистичных изображений
Alibaba выпустила Z-Image — открытую модель для генерации фотореалистичных изображений
Компания Alibaba представила модель Z-Image, предназначенную для генерации фотореалистичных изображений. По заявлениям разработчиков, качество результатов сопоставимо с уровнем Flux 2. Демоверсия модели доступна бесплатно на платформе HuggingFace.
Главная особенность Z-Image — компактный размер при высоком качестве. Модель содержит всего 6 миллиардов параметров, в то время как Flux 2 использует 32 миллиарда параметров (более чем в пять раз больше).
Возможности системы
Разработчики отмечают следующие возможности нейросети:
- воспроизведение достопримечательностей и видов городов мира по текстовому запросу;
- понимание описаний на разных языках и создание соответствующих изображений;
- рендеринг текста на английском и китайском языках.
Модель также обучали русскому, немецкому, французскому и испанскому языкам, однако на этих языках Z-Image пока допускает ошибки — требуется дополнительное обучение для улучшения качества.
Варианты доступности модели
Z-Image доступна в нескольких вариантах:
- бесплатная демоверсия — можно попробовать на HuggingFace прямо в браузере;
- версия Z-Image Turbo — код и веса выложены на трёх платформах: GitHub, HuggingFace и ModelScope.
Технические требования и преимущества
Одно из важных преимуществ модели — низкие требования к оборудованию. Для работы Z-Image Turbo подойдут видеокарты с 16 ГБ видеопамяти, что делает модель доступной для широкого круга пользователей (многие современные игровые карты имеют такой объём памяти).
Планы компании
Alibaba планирует расширить линейку моделей:
- Z-Image Edit — версия, предназначенная для редактирования готовых изображений (будет опубликована позже);
- улучшенная версия Z-Image Base — будет более «тяжёлой», но обеспечит лучшее качество результатов.
Значение выхода Z-Image
Выход Z-Image усиливает конкуренцию на рынке генеративных моделей для изображений. Китайские компании активно развивают собственные решения в области ИИ. Открытая лицензия позволяет разработчикам использовать модель в своих проектах без ограничений.
Компактный размер модели открывает новые возможности: генерация изображений становится доступной на менее мощном оборудовании. Это может ускорить внедрение технологий ИИ в различных приложениях и сервисах.
