大模型BrowseComp评测基准详情以及最新排行结果

BrowseComp 大模型得分排行榜

数据来源：DataLearnerAI

默认：仅展示常规/非并行的评测结果，可按需查看并行思考成绩。

默认隐藏并行思考结果。

排名

模型

得分

发布时间

参数(亿)

GPT-5 default

90.0

2025-08-07

未知

GPT-5 default

90.0

BrowseComp得分 90.0

发布时间 2025-08-07

参数(亿) 未知

查看模型详情

GPT-5.1 default

90.0

2025-11-12

未知

GPT-5.1 default

90.0

BrowseComp得分 90.0

发布时间 2025-11-12

参数(亿) 未知

查看模型详情

GPT-5.4 Pro 思考模式 High（工具）

89.3

2026-03-05

未知

GPT-5.4 Pro 思考模式 High（工具）

89.3

BrowseComp得分 89.3

发布时间 2026-03-05

参数(亿) 未知

查看模型详情

Gemini 3.1 Pro Preview default

85.9

2026-02-20

未知

Gemini 3.1 Pro Preview default

85.9

BrowseComp得分 85.9

发布时间 2026-02-20

参数(亿) 未知

查看模型详情

Claude Opus 4.6 default

84.0

2026-02-05

未知

Claude Opus 4.6 default

84.0

BrowseComp得分 84.0

发布时间 2026-02-05

参数(亿) 未知

查看模型详情

Claude Opus 4.6 常规模式（工具+联网）

83.73

2026-02-05

未知

Claude Opus 4.6 常规模式（工具+联网）

83.73

BrowseComp得分 83.73

发布时间 2026-02-05

参数(亿) 未知

查看模型详情

GPT-5.4 极高强度思考（工具）

82.7

2026-03-05

未知

GPT-5.4 极高强度思考（工具）

82.7

BrowseComp得分 82.7

发布时间 2026-03-05

参数(亿) 未知

查看模型详情

Qwen3.5-397B-A17B 思考模式（工具+联网）

78.6

2026-02-16

397.0

Qwen3.5-397B-A17B 思考模式（工具+联网）

78.6

BrowseComp得分 78.6

发布时间 2026-02-16

参数(亿) 397.0

查看模型详情

GPT-5.2 Pro default

77.9

2025-12-11

未知

GPT-5.2 Pro default

77.9

BrowseComp得分 77.9

发布时间 2025-12-11

参数(亿) 未知

查看模型详情

MiniMax M2.5 default

76.3

2026-02-12

2290.0

#10

MiniMax M2.5 default

76.3

BrowseComp得分 76.3

发布时间 2026-02-12

参数(亿) 2290.0

查看模型详情

GLM-5 default

75.9

2026-02-11

7440.0

#11

GLM-5 default

75.9

BrowseComp得分 75.9

发布时间 2026-02-11

参数(亿) 7440.0

查看模型详情

Kimi K2.5 default

74.9

2026-01-27

10000.0

#12

Kimi K2.5 default

74.9

BrowseComp得分 74.9

发布时间 2026-01-27

参数(亿) 10000.0

查看模型详情

Claude Sonnet 4.6 default

74.7

2026-02-17

未知

#13

Claude Sonnet 4.6 default

74.7

BrowseComp得分 74.7

发布时间 2026-02-17

参数(亿) 未知

查看模型详情

Step 3.5 Flash default

69.0

2026-02-02

1960.0

#14

Step 3.5 Flash default

69.0

BrowseComp得分 69.0

发布时间 2026-02-02

参数(亿) 1960.0

查看模型详情

Qwen3.5-397B-A17B default

69.0

2026-02-16

397.0

#15

Qwen3.5-397B-A17B default

69.0

BrowseComp得分 69.0

发布时间 2026-02-16

参数(亿) 397.0

查看模型详情

GPT-5.2 极高强度思考（工具）

65.8

2025-12-11

未知

#16

GPT-5.2 极高强度思考（工具）

65.8

BrowseComp得分 65.8

发布时间 2025-12-11

参数(亿) 未知

查看模型详情

GLM-5 default

62.0

2026-02-11

7440.0

#17

GLM-5 default

62.0

BrowseComp得分 62.0

发布时间 2026-02-11

参数(亿) 7440.0

查看模型详情

Qwen3.5-27B 思考模式（工具+联网）

61.0

2026-02-25

270.0

#18

Qwen3.5-27B 思考模式（工具+联网）

61.0

BrowseComp得分 61.0

发布时间 2026-02-25

参数(亿) 270.0

查看模型详情

Kimi K2.5 default

60.6

2026-01-27

10000.0

#19

Kimi K2.5 default

60.6

BrowseComp得分 60.6

发布时间 2026-01-27

参数(亿) 10000.0

查看模型详情

Kimi K2 Thinking default

60.2

2025-11-06

10400.0

#20

Kimi K2 Thinking default

60.2

BrowseComp得分 60.2

发布时间 2025-11-06

参数(亿) 10400.0

查看模型详情

Gemini 3.0 Pro (Preview 11-2025) default

59.2

2025-11-18

未知

#21

Gemini 3.0 Pro (Preview 11-2025) default

59.2

BrowseComp得分 59.2

发布时间 2025-11-18

参数(亿) 未知

查看模型详情

GPT-5 default

54.9

2025-08-07

未知

#22

GPT-5 default

54.9

BrowseComp得分 54.9

发布时间 2025-08-07

参数(亿) 未知

查看模型详情

GLM-4.7 default

52.0

2025-12-22

3580.0

#23

GLM-4.7 default

52.0

BrowseComp得分 52.0

发布时间 2025-12-22

参数(亿) 3580.0

查看模型详情

DeepSeek V3.2 default

51.4

2025-12-01

6710.0

#24

DeepSeek V3.2 default

51.4

BrowseComp得分 51.4

发布时间 2025-12-01

参数(亿) 6710.0

查看模型详情

GPT-5.1 思考模式 High（无工具）

50.8

2025-11-12

未知

#25

GPT-5.1 思考模式 High（无工具）

50.8

BrowseComp得分 50.8

发布时间 2025-11-12

参数(亿) 未知

查看模型详情

M2.1 default

47.4

2025-12-23

2300.0

#26

M2.1 default

47.4

BrowseComp得分 47.4

发布时间 2025-12-23

参数(亿) 2300.0

查看模型详情

GLM-4.6 default

45.1

2025-09-30

3550.0

#27

GLM-4.6 default

45.1

BrowseComp得分 45.1

发布时间 2025-09-30

参数(亿) 3550.0

查看模型详情

MiniMax M2 default

44.0

2025-10-27

2300.0

#28

MiniMax M2 default

44.0

BrowseComp得分 44.0

发布时间 2025-10-27

参数(亿) 2300.0

查看模型详情

GLM-4.7-Flash default

42.8

2026-01-19

310.0

#29

GLM-4.7-Flash default

42.8

BrowseComp得分 42.8

发布时间 2026-01-19

参数(亿) 310.0

查看模型详情

DeepSeek V3.2-Exp default

40.1

2025-09-29

6710.0

#30

DeepSeek V3.2-Exp default

40.1

BrowseComp得分 40.1

发布时间 2025-09-29

参数(亿) 6710.0

查看模型详情

GPT OSS 20B default

28.3

2025-08-06

210.0

#31

GPT OSS 20B default

28.3

BrowseComp得分 28.3

发布时间 2025-08-06

参数(亿) 210.0

查看模型详情

Claude Sonnet 4.5 default

24.1

2025-09-30

未知

#32

Claude Sonnet 4.5 default

24.1

BrowseComp得分 24.1

发布时间 2025-09-30

参数(亿) 未知

查看模型详情

Gemini 2.5-Pro default

7.8

2025-06-05

未知

#33

Gemini 2.5-Pro default

7.8

BrowseComp得分 7.8

发布时间 2025-06-05

参数(亿) 未知

查看模型详情

Qwen3-30B-A3B-2507 default

2.29

2025-07-29

305.0

#34

Qwen3-30B-A3B-2507 default

2.29

BrowseComp得分 2.29

发布时间 2025-07-29

参数(亿) 305.0

查看模型详情

BrowseComp 评测基准详情

BrowseComp

模型模式说明

BrowseComp 大模型得分排行榜

BrowseComp

模型模式说明

BrowseComp 大模型得分排行榜

BrowseComp详细排名数据表格