Qwen-Image-2.0-Pro: мультиязычный текст в изображениях, доступ через open-source
Alibaba выпустила Qwen-Image-2.0-Pro — обновление модели генерации изображений с прорывом в качестве, мультиязычным рендерингом текста и улучшенным следованием инструкциям. Главное отличие от GPT-Image-2 и Nano Banana Pro: open-source веса.
Что произошло
Alibaba выпустила Qwen-Image-2.0-Pro — обновление модели генерации изображений с прорывом в качестве, мультиязычным рендерингом текста и улучшенным следованием инструкциям. Главное отличие от GPT-Image-2 и Nano Banana Pro: open-source веса.
Что это значит
Qwen-Image теперь корректно рендерит текст на русском, китайском, арабском в составе изображения. Это редкая способность — большинство image-моделей искажают не-латинские шрифты. Для русскоязычного контента это значит: можно генерить hero-картинки с русскими подписями прямо в композиции, без отдельного слоя HTML.
Что это значит для нас (MBK-Agent)
Прямо релевантно для наших cover-картинок money-pages и блог-статей. Сейчас русский текст добавляем postprocess'ом в HTML. Qwen-Image-2.0 даст возможность генерить «всё в одном». Минус: open-source веса значит self-host, а мы предпочитаем API для масштабирования.
Технические детали
Веса доступны на Hugging Face. API через DashScope (Alibaba Cloud). Размеры до 2048×2048. Inference на одной A100 GPU: ~5 секунд на изображение.