Gemini 3.0 Flash
支持
2000K tokens
65536 tokens
聊天大模型
2025-12-17
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0.5 美元/100万 tokens | 3 美元/100万 tokens |
| 图片 | 0.5 美元/100万 tokens | |
| 音频 | 1 美元/100万 tokens | |
| 视频 | 0.5 美元/100万 tokens |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 0.05 美元/100万 tokens | |
| 图片 | 0.05 美元/100万 tokens | |
| 音频 | 0.1 美元/100万 tokens | |
| 视频 | 0.05 美元/100万 tokens |
2025 年 12 月 17 日,Google 正式发布了 Gemini 3 Flash 模型。
这是 Gemini 3 系列中的一款高性能轻量模型,目前已经在 Gemini App 以及 Google 搜索的 AI Mode 中作为默认模型上线。
从发布方式来看,Gemini 3 Flash 并不是一个只面向开发者的补充型号,而是一开始就被放在了用户规模最大、调用频率最高的位置上。这也意味着,Google 对它的定位并不是“便宜版本”,而是一个可以长期承担主力任务的模型。
在 Gemini 体系里,Flash 一直代表的是“更快、更便宜、更适合大规模使用”。
但到了 Gemini 3 这一代,这条线的定位发生了一些变化。
Gemini 3 Flash 的目标不再只是“能用”,而是在保证速度和成本优势的同时,把能力尽量拉近 Pro 级模型。换句话说,它希望覆盖的是:
而不是只作为 Pro 的降级替代。
在技术规格上,Gemini 3 Flash 给得相当充分,这也是它能被直接用作默认模型的基础。
上下文能力
Gemini 3 Flash 支持 最多 100 万 token 的输入上下文,以及 64k token 的输出长度。
这使得它在长文档分析、代码仓库理解、多轮复杂对话等场景中,不再需要频繁切分输入。
知识更新
模型的知识截止时间为 2025 年 1 月,属于目前较新的水平,能够覆盖最近一年的技术与产品变化。
API 层模型标识
当前对外提供的模型 ID 为 gemini-3-flash-preview,处于 Preview 状态,但已经在多个核心产品中实际使用。
成本与调用定位
相较于 Pro 级模型,Gemini 3 Flash 的输入和输出成本明显更低,设计目标就是支持高频调用,而不是只在关键节点使用。
推理深度可控
模型支持通过参数控制推理强度,在“尽量快”和“更稳一点”之间切换。这让同一个模型可以适配不同复杂度的任务,而不必频繁更换模型。
如果只是速度提升,其实不足以支撑它成为默认模型。
Gemini 3 Flash 的变化,更多体现在整体能力结构上。
推理能力更接近 Pro
在多步骤问题、复杂问答、逻辑分析等场景中,Gemini 3 Flash 给出的回答已经很难被直观区分为“轻量模型”。
很多时候,它的输出质量已经足够让人不再纠结是否需要切换到 Pro。
编程与 Agent 场景明显加强
在真实的编码任务中,Gemini 3 Flash 更偏向“能把任务跑完”,而不是只给思路或片段建议。
在多轮修改、上下文保持和工具配合上,稳定性比上一代 Flash 有明显提升。
性能与延迟更稳定
即使在推理强度提高的情况下,整体响应时间仍然控制得比较好,这也是它能够被用于搜索和高频交互场景的重要前提。
从公开测试结果和开发者的实际反馈来看,Gemini 3 Flash 有一个很明显的特征:
它不是那种“某一项特别亮眼”的模型,而是一个长期使用时不容易成为短板的模型。
比较常见的反馈包括:
也正因为这些特点,越来越多的 Agent 系统开始把它作为默认执行模型,而不是只在兜底或低价值场景中使用。
简单来说,如果你希望一个模型既够快,又不太容易出问题,Gemini 3 Flash 是一个很合适的默认选择。
它尤其适合用在:
它并不追求极限能力,而是把速度、成本和回答质量放在一个相对均衡的位置上。
对大多数真实业务来说,这种选择反而更省心。
当然,它也不是万能的。
如果你的任务是:
那么使用更高规格、更慢但推理更激进的模型,仍然是更稳妥的选择。
Gemini 3 Flash 的意义,并不在于某一个单项分数,而在于它重新定义了“默认模型”应有的能力下限。
在 2025 年 12 月 17 日 这个时间点,Google 给出的答案是:
默认选项不一定意味着妥协,也可以是一个足够强、足够快、同时又适合大规模使用的主力模型。
--------------以下是旧的传闻,2025年12月17日发布-----------------------
2025年10月初,网络盛传Google即将发布Gemini 3.0模型,根据谷歌的模型系列,应该会包含2个版本,分别是Gemini 3.0 Pro和Gemini 3.0 Flash。2025年10月19日,LMAreana上出现了几个神秘模型,从回答中可以看到明显是Google发布的模型,大家普遍认为这些模型就是Gemini 3.0。
其中:
lithiumflow = Gemini 3.0 Pro (no Grounding w/ Google Search)
orionmist = Gemini 3.0 Pro (Grounding w/ Google Search)
关注DataLearnerAI微信公众号,接受最新大模型资讯