GP

GPT-5

基础大模型

GPT-5

发布时间: 2025-08-07

1,702
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
400K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

400K tokens

最长输出结果

131072 tokens

模型类型

基础大模型

发布时间

2025-08-07

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode) 深度思考(Deeper Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 1.25 美元/100 万tokens 10 美元/100 万tokens

GPT-5模型在各大评测榜单的评分

综合评估

共 16 项评测
GPQA Diamond thinking + 使用工具
87.30
8 / 135
85.70
12 / 135
LiveBench high
79.33
1 / 51
LiveBench medium
78.85
2 / 51
GPQA Diamond normal
77.80
46 / 135
ARC-AGI high
65.70
7 / 34
ARC-AGI medium
56.20
13 / 34
ARC-AGI low
44
15 / 34
HLE thinking + 使用工具
35.20
10 / 72
HLE thinking
24.80
19 / 72
ARC-AGI-2 high
9.90
8 / 24
ARC-AGI-2 medium
7.50
11 / 24
HLE normal
6.30
62 / 72
ARC-AGI normal
6
32 / 34
ARC-AGI-2 low
1.90
18 / 24
ARC-AGI-2 normal
0
24 / 24

编程与软件工程

共 2 项评测
72.80
16 / 68
36.30
4 / 5

数学推理

共 12 项评测
AIME2025 thinking + 使用工具
99.60
5 / 95
AIME2025 thinking
94.60
18 / 95
AIME2025 normal
61.90
70 / 95
IMO-ProofBench thinking
59
2 / 16
IMO 2025 thinking
29
2 / 9
FrontierMath high + 使用工具
26.30
4 / 50
24.80
5 / 50
FrontierMath medium
24.80
5 / 50
20
2 / 8
IMO 2024 thinking
11
4 / 10
8.30
4 / 27
6.30
5 / 27

AI Agent - 工具使用

共 1 项评测
Terminal-Bench thinking + 使用工具
43.80
8 / 35

多模态理解

共 1 项评测
MMMU high
84.20
2 / 17

常识推理

共 1 项评测
56.70
8 / 25

Agent能力评测

共 3 项评测
τ²-Bench - Telecom high + 使用工具
96.70
3 / 17
τ²-Bench - Telecom thinking + 使用工具
95.80
4 / 17
τ²-Bench thinking + 使用工具
80
6 / 26

指令跟随

共 1 项评测
IF Bench high
73.10
1 / 14

AI Agent - 信息收集

共 2 项评测
BrowseComp high + 使用工具
90
1 / 10
BrowseComp thinking + 使用工具
54.90
4 / 10

发布机构

GPT-5模型解读

----------2025年8月7日

OpenAI官方宣布,将在2025年8月7日发布新一代GPT-5模型



----------2025年7月13日

传闻OpenAI会在2025年7月份发布GPT-5,2025年7月13日,推特上泄露出GPT-5的评测结果,但不确定真假。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat