Tencent HunyuanImage-3.0-Instruct
不支持
128K tokens
4096 tokens
视觉大模型
2026-01-28
170GB
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0 | |
| 图片 | 0 | 0 |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 0 | |
| 图片 | 0 | 0 |
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0 | |
| 图片 | 0 | 0 |
HunyuanImage-3.0-Instruct 是腾讯混元(Tencent Hunyuan)团队于 2026 年 1 月正式开源的旗舰级图像生成与编辑模型。作为 HunyuanImage 3.0 系列的核心成员,它专为高难度的指令遵循(Instruction Following)和图像编辑任务设计。该模型采用了先进的 MoE(Mixture of Experts) 架构,是目前业界规模最大的开源图像生成模型之一。其核心目标是解决复杂自然语言指令下的精确图像编辑、多图融合及长文本理解问题,通过引入原生的思维链(Chain-of-Thought, CoT)机制,显著提升了模型对用户意图的推理与执行能力。
根据官方及社区的初步评测,HunyuanImage-3.0-Instruct 在图像编辑准确性、多图融合的一致性以及长文本生成的语义对齐上,表现达到了开源领域的 SOTA(State-of-the-Art)水平,在 LMArena 等基准测试的图像编辑榜单中名列前茅,综合能力足以对标顶尖的闭源商业模型(如 Midjourney v6 等)。
关注DataLearnerAI微信公众号,接受最新大模型资讯