大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/code

筛选条件

大模型排名数据表格

排名
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1 Anthropic Logo
Claude Sonnet 4.5
parallel_thinking + 使用工具
82.00 未公布 未公布 未知 不开源
2 Anthropic Logo
Claude Opus 4.5
thinking
80.90 未公布 未公布 未知 不开源
3 Anthropic Logo
Claude Sonnet 4
parallel_thinking + 使用工具
80.20 未公布 未公布 未知 不开源
4 OpenAI Logo
GPT-5.2
thinking
80.00 未公布 未公布 未知 不开源
5 Anthropic Logo
Claude Opus 4.1
parallel_thinking + 使用工具
79.40 未公布 未公布 未知 不开源
6 Anthropic Logo
Claude Sonnet 4.5
thinking + 使用工具
77.20 未公布 未公布 未知 不开源
7 OpenAI Logo
GPT-5.1-Codex-Max
high + 使用工具
76.80 未公布 未公布 未知 不开源
8 OpenAI Logo
GPT-5.1
high
76.30 未公布 未公布 未知 不开源
9 Google Deep Mind Logo 76.20 92.00 未公布 未知 不开源
10 OpenAI Logo
o3-pro
high
75.00 未公布 未公布 未知 不开源
11 OpenAI Logo 74.50 未公布 未公布 未知 不开源
12 Anthropic Logo
Claude Opus 4.1
thinking + 使用工具
74.50 65.00 未公布 未知 不开源
13 Anthropic Logo
Claude Opus 4.1
thinking
74.50 未公布 未公布 未知 不开源
14 xAI Logo
Grok 4 Heavy
parallel_thinking + 使用工具
73.50 未公布 未公布 未知 不开源
15 Anthropic Logo
Haiku 4.5
thinking + 使用工具
73.30 未公布 未公布 未知 不开源
16 DeepSeek-AI Logo
DeepSeek V3.2
thinking + 使用工具
73.10 未公布 未公布 6,710 免费商用授权
17 OpenAI Logo
GPT-5
high
72.80 未公布 未公布 未知 不开源
18 Anthropic Logo
Claude Sonnet 4
thinking + 使用工具
72.70 未公布 未公布 未知 不开源
19 Anthropic Logo 72.50 56.60 未公布 未知 不开源
20 xAI Logo 72.00 未公布 未公布 未知 不开源
21 Moonshot AI Logo
Kimi K2 Thinking
thinking + 使用工具
71.30 未公布 未公布 10,400 免费商用授权
22 xAI Logo
Grok Code Fast 1
thinking
70.80 未公布 未公布 未知 不开源
23 OpenAI Logo
GPT-5.1 Codex
high + 使用工具
70.40 85.50 未公布 未知 不开源
24 Anthropic Logo 70.30 未公布 未公布 未知 不开源
25 阿里巴巴 Logo 69.60 57.50 未公布 未知 不开源
26 MiniMaxAI Logo
MiniMax M2
thinking + 使用工具
69.40 未公布 未公布 2,300 免费商用授权
27 Moonshot AI Logo 69.20 未公布 未公布 10,000 免费商用授权
28 Moonshot AI Logo
Kimi K2 0905
thinking + 使用工具
69.20 未公布 未公布 10,000 免费商用授权
29 OpenAI Logo
OpenAI o3
thinking
69.10 未公布 未公布 未知 不开源
30 Google Deep Mind Logo
Gemini 3.0 Flash
thinking
68.70 未公布 未公布 未知 不开源
31 DeepSeek-AI Logo 68.40 74.90 未公布 6,710 免费商用授权
32 OpenAI Logo
OpenAI o4 - mini
thinking
68.10 未公布 未公布 未知 不开源
33 智谱AI Logo 68.00 56.00 未公布 3,550 免费商用授权
34 智谱AI Logo
GLM-4.6
thinking + 使用工具
68.00 84.50 未公布 3,550 免费商用授权
35 DeepSeek-AI Logo
DeepSeek V3.2-Exp
thinking + 使用工具
67.80 未公布 未公布 6,710 免费商用授权
36 Google Deep Mind Logo
Gemini 2.5-Pro
thinking
67.20 未公布 未公布 未知 不开源
37 阿里巴巴 Logo 67.00 未公布 未公布 4,800 免费商用授权
38 DeepSeek-AI Logo 66.00 56.40 未公布 6,710 免费商用授权
39 Anthropic Logo 64.80 59.00 未公布 未知 不开源
40 智谱AI Logo
GLM-4.5
thinking
64.20 72.90 未公布 3,550 免费商用授权
41 Google Deep Mind Logo 63.80 70.40 未公布 未知 不开源
42 Google Deep Mind Logo 63.20 77.10 未公布 未知 不开源
43 MistralAI Logo 61.60 未公布 未公布 未知 不开源
44 Anthropic Logo 60.60 51.00 未公布 未知 不开源
45 OpenAI Logo
GPT OSS 120B
thinking
60.10 未公布 未公布 117 免费商用授权
46 xAI Logo
Grok 4
thinking
58.60 82.00 未公布 未知 不开源
47 DeepSeek-AI Logo
DeepSeek-R1-0528
thinking
57.60 73.30 未公布 6,710 免费商用授权
48 智谱AI Logo
GLM-4.5-Air
thinking
57.60 70.70 未公布 1,060 免费商用授权
49 MiniMaxAI Logo 56.00 65.00 未公布 4,560 免费商用授权
50 MiniMaxAI Logo 55.60 62.30 未公布 4,560 免费商用授权
51 OpenAI Logo 54.60 40.50 未公布 未知 不开源
52 Google Deep Mind Logo 54.00 未公布 未公布 未知 不开源
53 MistralAI Logo 53.60 未公布 未公布 240 免费商用授权
54 Moonshot AI Logo 51.80 53.70 未公布 10,000 免费商用授权
55 阿里巴巴 Logo 51.60 未公布 未公布 305 免费商用授权
56 Google Deep Mind Logo 50.00 41.10 未公布 未知 不开源
57 OpenAI Logo 49.30 69.50 97.60 未知 不开源
58 DeepSeek-AI Logo 49.20 65.90 未公布 6,710 免费商用授权
59 Anthropic Logo 49.00 38.70 93.70 未知 不开源
60 Google Deep Mind Logo
Gemini 2.5 Flash
thinking
48.90 55.40 未公布 未知 不开源
61 OpenAI Logo 48.90 71.00 未公布 未知 不开源
62 MistralAI Logo 46.80 未公布 未公布 240 免费商用授权
63 OpenAI Logo
OpenAI o3-mini
thinking
40.80 未公布 未公布 未知 不开源
64 DeepSeek-AI Logo 38.80 49.20 未公布 6,710 免费商用授权
65 OpenAI Logo 38.00 46.40 未公布 未知 不开源
66 阿里巴巴 Logo 34.40 70.70 未公布 2,350 免费商用授权
67 OpenAI Logo 31.00 35.10 90.00 未知 不开源
68 Google Deep Mind Logo 27.60 34.30 未公布 未知 不开源
69 OpenAI Logo 23.60 未公布 未公布 未知 不开源
70 DeepMind Logo 21.40 29.10 未公布 未知 不开源
71 StepFunAI Logo 未公布 67.10 未公布 3,210 免费商用授权
72 Anthropic Logo
Claude Sonnet 4
thinking
未公布 66.00 未公布 未知 不开源
73 Moonshot AI Logo 未公布 65.90 未公布 未知 不开源
74 阿里巴巴 Logo 未公布 65.70 未公布 320 免费商用授权
75 腾讯AI实验室 Logo 未公布 64.90 未公布 未知 不开源
76 阿里巴巴 Logo 未公布 65.60 未公布 未知 免费商用授权
77 华为 Logo 未公布 67.10 未公布 70 免费商用授权
78 OpenAI Logo 未公布 67.40 未公布 未知 不开源
79 xAI Logo 未公布 70.60 未公布 未知 不开源
80 阿里巴巴 Logo
Qwen3-235B-A22B
thinking
未公布 70.70 未公布 2,350 免费商用授权
81 Anthropic Logo 未公布 71.00 未公布 未知 不开源
82 Moonshot AI Logo 未公布 73.80 未公布 未知 不开源
83 DeepSeek-AI Logo 未公布 74.10 未公布 6,710 免费商用授权
84 阿里巴巴 Logo 未公布 74.10 未公布 305 免费商用授权
85 阿里巴巴 Logo 未公布 74.10 未公布 2,350 免费商用授权
86 DeepSeek-AI Logo
DeepSeek-V3.1
thinking
未公布 74.80 未公布 6,710 免费商用授权
87 OpenAI Logo 未公布 75.80 未公布 未知 不开源
88 智谱AI Logo 未公布 51.80 未公布 90 免费商用授权
89 Google Deep Mind Logo 未公布 24.60 未公布 120 免费商用授权
90 DeepMind Logo 未公布 28.90 未公布 未知 不开源
91 阿里巴巴 Logo 未公布 29.00 未公布 305 免费商用授权
92 Facebook AI研究实验室 Logo 未公布 32.80 未公布 1,090 免费商用授权
93 阿里巴巴 Logo 未公布 35.10 未公布 40 免费商用授权
94 OpenAI Logo 未公布 35.80 未公布 未知 不开源
95 百度 Logo 未公布 38.80 未公布 3,000 免费商用授权
96 百度 Logo 未公布 38.80 未公布 4,240 免费商用授权
97 阿里巴巴 Logo 未公布 43.20 未公布 305 免费商用授权
98 Facebook AI研究实验室 Logo 未公布 43.40 未公布 4,000 免费商用授权
99 Anthropic Logo 未公布 48.50 未公布 未知 不开源
100 Facebook AI研究实验室 Logo 未公布 49.40 未公布 20,000 免费商用授权
101 阿里巴巴 Logo 未公布 51.80 未公布 2,350 免费商用授权
102 智谱AI Logo
GLM-4.6
thinking
未公布 82.80 未公布 3,550 免费商用授权
103 DeepSeek-AI Logo 未公布 55.00 未公布 6,710 免费商用授权
104 OpenAI Logo
GPT-5-mini
thinking
未公布 55.00 未公布 未知 不开源
105 阿里巴巴 Logo 未公布 55.20 未公布 40 免费商用授权
106 MistralAI Logo 未公布 55.84 未公布 240 免费商用授权
107 阿里巴巴 Logo 未公布 56.60 未公布 800 免费商用授权
108 Tencent ARC Logo 未公布 57.00 未公布 70 免费商用授权
109 阿里巴巴 Logo
Qwen3-8B
thinking
未公布 57.50 未公布 80 免费商用授权
110 MistralAI Logo 未公布 59.36 未公布 未知 不开源
111 华为 Logo 未公布 59.60 未公布 719 免费商用授权
112 阿里巴巴 Logo 未公布 61.80 未公布 80 免费商用授权
113 Anthropic Logo
Haiku 4.5
thinking
未公布 62.00 未公布 未知 不开源
114 腾讯AI实验室 Logo 未公布 63.90 未公布 800 免费商用授权
115 阿里巴巴 Logo 未公布 未公布 73.20 未知 不开源
116 xAI Logo 未公布 未公布 88.40 2,690 免费商用授权
117 Anthropic Logo 未公布 未公布 88.10 未知 不开源
118 Google Deep Mind Logo 未公布 29.70 87.80 270 免费商用授权
119 OpenAI Logo 未公布 未公布 87.20 未知 不开源
120 MistralAI Logo 未公布 37.90 86.60 未知 不开源
121 Anthropic Logo 未公布 未公布 84.90 未知 不开源
122 MistralAI Logo 未公布 31.50 81.10 220 不可以商用
123 Facebook AI研究实验室 Logo 未公布 33.30 80.50 700 免费商用授权
124 Microsoft Logo 未公布 未公布 74.40 38 免费商用授权
125 xAI Logo 未公布 未公布 74.10 未知 不开源
126 Facebook AI研究实验室 Logo 未公布 33.30 88.40 700 免费商用授权
127 Facebook AI研究实验室 Logo 未公布 未公布 66.50 80 免费商用授权
128 CohereAI Logo 未公布 未公布 62.20 320 不可以商用
129 阿里巴巴 Logo 未公布 未公布 59.10 727 免费商用授权
130 阿里巴巴 Logo 未公布 未公布 57.90 70 免费商用授权
131 Moonshot AI Logo 未公布 未公布 48.10 160 免费商用授权
132 阿里巴巴 Logo 未公布 未公布 42.10 30 免费商用授权
133 Google Research Logo 未公布 未公布 37.80 90 免费商用授权
134 Facebook AI研究实验室 Logo 未公布 未公布 33.50 80 免费商用授权
135 MistralAI Logo 未公布 未公布 29.30 70 免费商用授权
136 Facebook AI研究实验室 Logo 未公布 未公布 28.00 32 免费商用授权
137 Google Deep Mind Logo
Gemini 2.5 Deep Think
deeper_thinking
未公布 87.60 未公布 未知 不开源
138 xAI Logo 未公布 79.40 未公布 未知 不开源
139 DeepSeek-AI Logo 未公布 80.00 未公布 6,710 免费商用授权
140 xAI Logo
Grok 4 Fast
thinking
未公布 80.00 未公布 未知 不开源
141 Google Deep Mind Logo 未公布 80.40 未公布 未知 不开源
142 xAI Logo
Grok 4.1 Fast
thinking
未公布 82.00 未公布 未知 不开源
143 阿里巴巴 Logo 未公布 未公布 19.00 325 免费商用授权
144 MiniMaxAI Logo
MiniMax M2
thinking
未公布 83.00 未公布 2,300 免费商用授权
145 Moonshot AI Logo
Kimi K2 Thinking
thinking
未公布 83.10 未公布 10,400 免费商用授权
146 DeepSeek-AI Logo
DeepSeek V3.2
thinking
未公布 83.30 未公布 6,710 免费商用授权
147 Anthropic Logo
Claude Opus 4.5
thinking + 使用工具
未公布 87.00 未公布 未知 不开源
148 Google Deep Mind Logo 未公布 77.10 未公布 未知 不开源
149 OpenAI Logo 未公布 52.00 92.40 未知 不开源
150 Anthropic Logo 未公布 未公布 92.00 未知 不开源
151 腾讯AI实验室 Logo 未公布 32.00 91.00 未知 不开源
152 OpenAI Logo 未公布 未公布 90.20 未知 不开源
153 Google Deep Mind Logo 未公布 未公布 89.00 未知 不开源
154 Facebook AI研究实验室 Logo 未公布 30.20 89.00 4,050 免费商用授权
155 亚马逊 Logo 未公布 未公布 89.00 未知 不开源
156 DeepSeek-AI Logo 未公布 34.60 89.00 6,810 免费商用授权
157 MistralAI Logo 未公布 未公布 88.41 240 免费商用授权
158 阿里巴巴 Logo 未公布 51.20 88.40 320 免费商用授权
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.90
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 77.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.20
LiveCodeBench (编程与软件工程) 92.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 72.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.50
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 71.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.40
LiveCodeBench (编程与软件工程) 85.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.60
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.40
LiveCodeBench (编程与软件工程) 74.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 56.00
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 84.50
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 67.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 4,800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 66.00
LiveCodeBench (编程与软件工程) 56.40
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 64.80
LiveCodeBench (编程与软件工程) 59.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 64.20
LiveCodeBench (编程与软件工程) 72.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 63.80
LiveCodeBench (编程与软件工程) 70.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 63.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 61.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.60
LiveCodeBench (编程与软件工程) 51.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 58.60
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 73.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 56.00
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 55.60
LiveCodeBench (编程与软件工程) 62.30
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 54.60
LiveCodeBench (编程与软件工程) 40.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 54.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 53.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.80
LiveCodeBench (编程与软件工程) 53.70
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 50.00
LiveCodeBench (编程与软件工程) 41.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.30
LiveCodeBench (编程与软件工程) 69.50
HumanEval (编程与软件工程) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.20
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 49.00
LiveCodeBench (编程与软件工程) 38.70
HumanEval (编程与软件工程) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 55.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 46.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 40.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 38.80
LiveCodeBench (编程与软件工程) 49.20
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 38.00
LiveCodeBench (编程与软件工程) 46.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 34.40
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 31.00
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 27.60
LiveCodeBench (编程与软件工程) 34.30
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 23.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 21.40
LiveCodeBench (编程与软件工程) 29.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 66.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.70
HumanEval (编程与软件工程) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 64.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 73.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.80
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 75.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 24.60
HumanEval (编程与软件工程) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 28.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.00
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.80
HumanEval (编程与软件工程) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.20
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.40
HumanEval (编程与软件工程) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 48.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 49.40
HumanEval (编程与软件工程) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.20
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.84
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.00
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.36
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.60
HumanEval (编程与软件工程) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 61.80
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 62.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 63.90
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.40
参数(亿) 2,690
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.70
HumanEval (编程与软件工程) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 37.90
HumanEval (编程与软件工程) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 31.50
HumanEval (编程与软件工程) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 79.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.00
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.10
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 52.00
HumanEval (编程与软件工程) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.00
HumanEval (编程与软件工程) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 30.20
HumanEval (编程与软件工程) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 34.60
HumanEval (编程与软件工程) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.20
HumanEval (编程与软件工程) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情