Seed-1.6-Embedding-250615
不支持
128K tokens
embedding模型
2025-06-28
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0.125 USD/百万tokens(文本输入) | |
| 图片 | 0.325 USD/百万tokens(图片输入) | |
| Embedding | 0 USD/百万tokens(输出) |
Seed-1.6-Embedding 是字节跳动 Seed 团队在 2025-06-28 公布的一款向量模型,用于将内容编码为向量表示,面向检索、匹配、分类等场景。官方文章同时给出该模型在火山引擎的 API Model ID 为 doubao-embedding-vision-250615。
在 BytePlus ModelArk 文档中,该模型以 embedding-vision 作为推荐模型条目,并列出多个版本号。ModelArk 版本号 embedding-vision-250615 对应本条目(250615)。
官方文章描述该模型基于 Seed1.6-Flash,并采用双塔(dual-tower)结构;向量抽取为最后一层隐藏层中与 [EOS] token 对应的向量表示。
官方文章将训练过程描述为三阶段:文本继续训练、多模态继续训练、以及微调。训练目标包含从 VLM 基座获得 embedding 能力、多模态(图像/视频与文本)对齐,以及面向多任务/多场景的数据构建与训练。
官方文章披露:在 C-MTEB(中文)榜单上报告得分 75.62;在 MMEB-V2 Image 榜单上报告得分 77.78,并披露与第二名的差值;同时披露在 MMEB-V2 Video 榜单上也取得领先差值(以官方图表与文字为准)。
BytePlus ModelArk 文档描述 embedding-vision 支持中英文,并支持文本、图像、视频等混合输入;其中 250615 及后续版本支持视频输入,并给出最大上下文长度为 128K(250615)/ 8K(其他版本)。
BytePlus ModelArk 文档给出按 token 计费:文本输入 0.125 USD/百万 tokens、图片输入 0.325 USD/百万 tokens、输出 0;缓存命中与缓存存储标注为“不涉及”。文档未在该条目中单列视频输入价格。
上述官方发布文章与 ModelArk 文档未提供可下载权重或开源仓库地址;该模型以在线服务形式提供访问。
关注DataLearnerAI微信公众号,接受最新大模型资讯