2025-08-05 14:29:31
76人关注
通义千问重磅开源Qwen-Image:20B参数MMDiT模型全面刷新图像生成SOTA
通义千问8月5日正式开源了其首个图像生成基础模型Qwen-Image,这款20B参数的MMDiT(多模态扩散变换器)模型在文本渲染和图像编辑领域实现了重大突破。该模型不仅在多个权威基准测试中获得了SOTA(最佳性能)成绩,更在复杂文本渲染和精确图像编辑方面展现出显著优势。
通义千问开源
Qwen-Image模型
多模态扩散变换器
图像生成基础模型
文本渲染技术
精确图像编辑