Gemini 3 Deep Think - 2620

推理大模型

Gemini 3 Deep Think February 2026 Upgrade

发布时间: 2026-02-13

285

GitHub Hugging Face 在线体验

模型参数（Parameters）

未披露

最高上下文长度（Context Length）

是否支持中文

不支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

1M tokens

最长输出结果

64000 tokens

模型类型

推理大模型

发布时间

2026-02-13

模型预文件大小

暂无数据

推理模式

深度思考(Deeper Thinking Mode)

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源 - 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.google.com/

官方介绍与博客

官方论文

Gemini 3 Deep Think: Advancing science, research and engineering

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

接口价格

默认单位：$/100万 tokens；若计费单位不同，则以供应商公开的原始标注为准。

标准计费 Standard

模态	输入	输出
文本	2.00 ≤ 200000	12.00 ≤ 200000

超上下文计费 Extended

模态	输入	输出
文本	4.00 > 200000	18.00 > 200000

Gemini 3 Deep Think - 2620模型在各大评测榜单的评分

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

ARC-AGI default

1 / 50

ARC-AGI-2 default

84.60

1 / 42

HLE default

48.40

12 / 115

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

CodeForces default

3455

1 / 10

发布机构

Google Deep Mind

查看发布机构详情

Gemini 3 Deep Think February 2026 Upgrade模型解读

Gemini 3 Deep Think是Google DeepMind于2025年12月4日首次发布的专业推理模式,并于2026年2月13日推出重大升级版本。这是一种基于Gemini 3 Pro构建的高级推理模式,专门设计用于解决科学、研究和工程领域的复杂挑战。与常规的Gemini 3 Pro相比,Deep Think模式采用先进的并行推理技术,能够同时探索多个假设,通过迭代推理过程产生更精细、更深入的解决方案。

该升级版本是与科学家和研究人员密切合作开发的,专注于处理那些缺乏明确边界、没有单一正确答案或数据不完整的复杂研究问题。Deep Think不仅在抽象理论上表现出色,还特别注重实际应用,能够帮助研究人员解读复杂数据,协助工程师通过代码建模物理系统。

性能与基准评测

2026年2月升级版在多个顶级基准测试中取得了突破性成绩。在Humanity's Last Exam(一个专门测试前沿模型极限的基准)上,该模型在不使用外部工具的情况下达到了48.4%的分数,相比12月版本的41.0%有显著提升。在ARC-AGI-2测试中,模型取得了84.6%的验证成绩(由ARC Prize Foundation验证),相比12月版本的45.1%实现了巨大飞跃,这证明了模型在适应全新任务而非依赖记忆模式方面的卓越能力。

在编程竞赛平台Codeforces上,Deep Think达到了3455的Elo评分,处于传奇大师级别,超越了绝大多数人类竞技程序员。模型在2025国际数学奥林匹克、2025国际物理奥林匹克和2025国际化学奥林匹克的笔试部分均达到金牌水平。在高级理论物理的CMT-Benchmark测试中获得50.5%的分数,展现了专业级研究能力。

核心能力与应用场景

Deep Think模式支持文本、图像、视频、音频和代码等多模态输入。其核心能力包括:复杂数据解释、物理系统代码建模、优化问题求解、以及能够将草图转换为3D可打印文件的能力。该模型在实际应用中已被多个研究机构采用,例如罗格斯大学的数学家Lisa Carbone使用Deep Think审查高度技术性的数学论文,成功识别出此前通过人工同行评审未被发现的细微逻辑缺陷;杜克大学的Wang实验室利用Deep Think优化复杂晶体生长的制造方法,用于潜在半导体材料的发现。

推荐应用场景包括:科学研究中的文献审查和假设验证、工程领域的复杂系统建模、高级数学问题求解、竞技编程、物理和化学领域的实验数据分析、以及从概念设计到3D打印的工程实现。

访问方式与限制

2026年2月升级版目前通过两种方式提供访问。Google AI Ultra订阅用户(订阅费用为每月250美元)可以在Gemini应用中直接使用,通过在提示栏中选择Deep Think并在模型下拉菜单中选择Gemini 3 Pro来访问。对于研究人员、工程师和企业用户,Google首次开放了通过Gemini API访问Deep Think的早期体验计划,需要通过申请获得访问权限。

Deep Think模式的响应通常需要几分钟时间完成,这是因为模型采用了更深层次的内部推理过程。该模式继承了Gemini 3 Pro的技术规格,包括100万tokens的输入上下文窗口和最多64,000 tokens的输出容量。

版本差异说明:相比2025年12月4日首次发布的版本,2026年2月13日的升级版在所有主要基准测试上都实现了显著提升,特别是在ARC-AGI-2上从45.1%提升至84.6%,在Humanity's Last Exam上从41.0%提升至48.4%。升级版还首次通过Gemini API向企业和研究机构开放,并增强了在科学研究和工程应用方面的实用性。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯