Qw

Qwen-Image-Edit-2511

视觉大模型

Qwen-Image-Edit-2511

发布时间: 2025-12-23

226
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度
暂无数据
最长输出结果
暂无数据
模型类型

视觉大模型

发布时间

2025-12-23

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

Qwen-Image-Edit-2511模型在各大评测榜单的评分

当前尚无可展示的评测数据。

发布机构

Qwen-Image-Edit-2511模型解读

Qwen-Image-Edit-2511 是阿里巴巴 Qwen 团队在 2025-12-23 发布并开源的图像编辑模型版本,定位为 Qwen-Image-Edit-2509 的迭代更新。官方说明该版本在一致性与多主体编辑等方面做了增强,并提供了面向开发者的权重与推理示例。

模型定位与核心能力

该模型用于“给定输入图像 + 自然语言编辑指令”生成编辑后的图像结果,属于图像到图像(image-to-image)的编辑范式。官方在模型卡中描述的改进点包括:降低编辑过程中的图像漂移、提升人物/角色一致性、集成部分社区 LoRA 能力(在不额外加载 LoRA 的情况下启用特定效果)、增强工业设计类生成以及几何推理相关能力。

使用方式与工程集成

在 Hugging Face 模型页中给出了基于 diffusers 的示例,使用 QwenImageEditPlusPipelineQwen/Qwen-Image-Edit-2511 加载权重,并以(可选)多张输入图像 + 文本指令的形式进行编辑推理。官方同时建议通过 Qwen Chat 的“Image Editing”功能体验该模型。

评测与对比信息(以公开口径为准)

在 QwenLM 的 Qwen-Image 仓库文档中,官方提到其引入了基于 Elo 的人类偏好评测平台(AI Arena)用于对生成/编辑能力进行对比展示;该信息用于说明其评测方法与平台背景。若需引用具体分数或榜单排名,请以官方平台当期页面为准。

开源与访问入口

该模型权重已在 Hugging Face 发布;Hugging Face 页面标注许可证为 Apache-2.0。在线交互方面,官方提供了可直接交互的 Hugging Face Space(上传图片并输入编辑指令)作为演示入口。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat