Qwen-Image-2512

多模态大模型

Qwen-Image-2512

发布时间: 2025-12-31

422

GitHub Hugging Face 在线体验

模型参数（Parameters）

200.0

最高上下文长度（Context Length）

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

暂无数据

最长输出结果

暂无数据

模型类型

多模态大模型

发布时间

2025-12-31

模型预文件大小

57.7 GB

推理模式

常规模式（Non-Thinking Mode）

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0 - 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen-Image

Hugging Face

https://huggingface.co/Qwen/Qwen-Image-2512

在线体验

https://huggingface.co/spaces/Qwen/Qwen-Image-2512

官方介绍与博客

官方论文

Qwen-Image Technical Report

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

接口价格

暂无公开的 API 定价信息。

Qwen-Image-2512模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

阿里巴巴

查看发布机构详情

Qwen-Image-2512模型解读

Qwen-Image-2512 是 Qwen 系列文本生成图像（Text-to-Image）的 2025 年 12 月更新版本，由阿里巴巴 Qwen 团队发布并开源权重。根据官方说明，它相对 2025 年 8 月发布的基础版本 Qwen-Image，主要面向“人像真实感、自然细节纹理、以及图像中文字渲染”三个方向做了增强，并提供可直接在 Qwen Chat 或 Hugging Face Demo 进行交互体验的入口。

模型定位与核心特点：官方将其描述为 Qwen-Image 文本生图基础模型的月度升级版本（December update）。改进重点包括：更自然的人像与面部细节（减少典型的“AI 质感”）、更精细的自然纹理表现（如风景、动物毛发等材质细节）、以及更强的文字渲染与版式布局能力（提升文本-图像组合与排版的准确性）。

评测与对比信息：在官方披露的 AI Arena 盲测中，Qwen-Image-2512 参与了超过 10,000 轮的盲评对战，结果显示其在开源模型中处于领先位置，并与部分闭源系统保持竞争力。该结论来自官方模型卡与仓库信息的公开描述。

使用方式与生态支持：官方提供 Hugging Face 权重与基于 diffusers 的推理方式（示例代码在模型卡与仓库中给出）。同时，官方仓库将其纳入 Qwen-Image 工具链与社区支持矩阵（包含推理加速与工作流工具等）。

许可与开源：官方仓库标注项目与相关内容采用 Apache-2.0 许可证；模型权重已在 Hugging Face 等平台公开发布，便于研究与工程集成（具体以权重页与许可证声明为准）。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯