大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/code

筛选条件

大模型排名数据表格

排名
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1 Anthropic Logo
Claude Sonnet 4.5
parallel_thinking + 使用工具
82.00 未公布 未公布 未知 不开源
2 Anthropic Logo
Claude Opus 4.5
thinking
80.90 未公布 未公布 未知 不开源
3 Anthropic Logo
Claude Sonnet 4
parallel_thinking + 使用工具
80.20 未公布 未公布 未知 不开源
4 OpenAI Logo
GPT-5.2
thinking
80.00 未公布 未公布 未知 不开源
5 Anthropic Logo
Claude Opus 4.1
parallel_thinking + 使用工具
79.40 未公布 未公布 未知 不开源
6 Anthropic Logo
Claude Sonnet 4.5
thinking + 使用工具
77.20 未公布 未公布 未知 不开源
7 OpenAI Logo
GPT-5.1-Codex-Max
high + 使用工具
76.80 未公布 未公布 未知 不开源
8 Moonshot AI Logo
Kimi K2.5
thinking
76.80 85.00 未公布 10,000 免费商用授权
9 OpenAI Logo
GPT-5.1
high
76.30 未公布 未公布 未知 不开源
10 Google Deep Mind Logo 76.20 92.00 未公布 未知 不开源
11 阿里巴巴 Logo 75.30 85.90 未公布 10,000 不开源
12 OpenAI Logo
o3-pro
high
75.00 未公布 未公布 未知 不开源
13 MiniMaxAI Logo
M2.1
thinking
74.80 未公布 未公布 2,300 免费商用授权
14 OpenAI Logo 74.50 未公布 未公布 未知 不开源
15 Anthropic Logo
Claude Opus 4.1
thinking + 使用工具
74.50 65.00 未公布 未知 不开源
16 Anthropic Logo
Claude Opus 4.1
thinking
74.50 未公布 未公布 未知 不开源
17 StepFunAI Logo
Step 3.5 Flash
thinking
74.40 86.40 未公布 1,960 免费商用授权
18 智谱AI Logo
GLM-4.7
thinking + 使用工具
73.80 未公布 未公布 3,580 免费商用授权
19 xAI Logo
Grok 4 Heavy
parallel_thinking + 使用工具
73.50 未公布 未公布 未知 不开源
20 Anthropic Logo
Haiku 4.5
thinking + 使用工具
73.30 未公布 未公布 未知 不开源
21 DeepSeek-AI Logo
DeepSeek V3.2
thinking + 使用工具
73.10 未公布 未公布 6,710 免费商用授权
22 OpenAI Logo
GPT-5
high
72.80 未公布 未公布 未知 不开源
23 Anthropic Logo
Claude Sonnet 4
thinking + 使用工具
72.70 未公布 未公布 未知 不开源
24 Anthropic Logo 72.50 56.60 未公布 未知 不开源
25 xAI Logo 72.00 未公布 未公布 未知 不开源
26 Moonshot AI Logo
Kimi K2 Thinking
thinking + 使用工具
71.30 未公布 未公布 10,400 免费商用授权
27 xAI Logo
Grok Code Fast 1
thinking
70.80 未公布 未公布 未知 不开源
28 阿里巴巴 Logo
Qwen3-Coder-Next
normal + 使用工具
70.60 未公布 未公布 80 免费商用授权
29 OpenAI Logo
GPT-5.1 Codex
high + 使用工具
70.40 85.50 未公布 未知 不开源
30 Anthropic Logo 70.30 未公布 未公布 未知 不开源
31 DeepSeek-AI Logo
DeepSeek V3.2
thinking
70.20 83.30 未公布 6,710 免费商用授权
32 阿里巴巴 Logo 69.60 57.50 未公布 未知 不开源
33 MiniMaxAI Logo
MiniMax M2
thinking + 使用工具
69.40 未公布 未公布 2,300 免费商用授权
34 Moonshot AI Logo 69.20 未公布 未公布 10,000 免费商用授权
35 Moonshot AI Logo
Kimi K2 0905
thinking + 使用工具
69.20 未公布 未公布 10,000 免费商用授权
36 OpenAI Logo
OpenAI o3
thinking
69.10 未公布 未公布 未知 不开源
37 Google Deep Mind Logo
Gemini 3.0 Flash
thinking
68.70 未公布 未公布 未知 不开源
38 DeepSeek-AI Logo 68.40 74.90 未公布 6,710 免费商用授权
39 OpenAI Logo
OpenAI o4 - mini
thinking
68.10 未公布 未公布 未知 不开源
40 智谱AI Logo 68.00 56.00 未公布 3,550 免费商用授权
41 智谱AI Logo
GLM-4.6
thinking + 使用工具
68.00 84.50 未公布 3,550 免费商用授权
42 DeepSeek-AI Logo
DeepSeek V3.2-Exp
thinking + 使用工具
67.80 未公布 未公布 6,710 免费商用授权
43 Google Deep Mind Logo
Gemini 2.5-Pro
thinking
67.20 未公布 未公布 未知 不开源
44 阿里巴巴 Logo 67.00 未公布 未公布 4,800 免费商用授权
45 DeepSeek-AI Logo 66.00 56.40 未公布 6,710 免费商用授权
46 Anthropic Logo 64.80 59.00 未公布 未知 不开源
47 智谱AI Logo
GLM-4.5
thinking
64.20 72.90 未公布 3,550 免费商用授权
48 Google Deep Mind Logo 63.80 70.40 未公布 未知 不开源
49 Google Deep Mind Logo 63.20 77.10 未公布 未知 不开源
50 MistralAI Logo 61.60 未公布 未公布 未知 不开源
51 Anthropic Logo 60.60 51.00 未公布 未知 不开源
52 OpenAI Logo
GPT OSS 120B
thinking
60.10 未公布 未公布 117 免费商用授权
53 智谱AI Logo
GLM-4.7-Flash
thinking
59.20 未公布 未公布 310 免费商用授权
54 xAI Logo
Grok 4
thinking
58.60 82.00 未公布 未知 不开源
55 DeepSeek-AI Logo
DeepSeek-R1-0528
thinking
57.60 73.30 未公布 6,710 免费商用授权
56 智谱AI Logo
GLM-4.5-Air
thinking
57.60 70.70 未公布 1,060 免费商用授权
57 MiniMaxAI Logo 56.00 65.00 未公布 4,560 免费商用授权
58 MiniMaxAI Logo 55.60 62.30 未公布 4,560 免费商用授权
59 OpenAI Logo 54.60 40.50 未公布 未知 不开源
60 Google Deep Mind Logo 54.00 未公布 未公布 未知 不开源
61 MistralAI Logo 53.60 未公布 未公布 240 免费商用授权
62 Moonshot AI Logo 51.80 53.70 未公布 10,000 免费商用授权
63 阿里巴巴 Logo 51.60 未公布 未公布 305 免费商用授权
64 Google Deep Mind Logo 50.00 41.10 未公布 未知 不开源
65 OpenAI Logo 49.30 69.50 97.60 未知 不开源
66 DeepSeek-AI Logo 49.20 65.90 未公布 6,710 免费商用授权
67 Anthropic Logo 49.00 38.70 93.70 未知 不开源
68 OpenAI Logo 48.90 71.00 未公布 未知 不开源
69 Google Deep Mind Logo
Gemini 2.5 Flash
thinking
48.90 55.40 未公布 未知 不开源
70 MistralAI Logo 46.80 未公布 未公布 240 免费商用授权
71 OpenAI Logo
OpenAI o3-mini
thinking
40.80 未公布 未公布 未知 不开源
72 DeepSeek-AI Logo 38.80 49.20 未公布 6,710 免费商用授权
73 OpenAI Logo 38.00 46.40 未公布 未知 不开源
74 阿里巴巴 Logo 34.40 70.70 未公布 2,350 免费商用授权
75 OpenAI Logo
GPT OSS 20B
thinking
34.00 未公布 未公布 210 免费商用授权
76 OpenAI Logo 31.00 35.10 90.00 未知 不开源
77 Google Deep Mind Logo 27.60 34.30 未公布 未知 不开源
78 OpenAI Logo 23.60 未公布 未公布 未知 不开源
79 阿里巴巴 Logo 22.00 未公布 未公布 305 免费商用授权
80 DeepMind Logo 21.40 29.10 未公布 未知 不开源
81 OpenAI Logo 未公布 75.80 未公布 未知 不开源
82 华为 Logo 未公布 67.10 未公布 70 免费商用授权
83 阿里巴巴 Logo 未公布 65.70 未公布 320 免费商用授权
84 Moonshot AI Logo 未公布 65.90 未公布 未知 不开源
85 Anthropic Logo
Claude Sonnet 4
thinking
未公布 66.00 未公布 未知 不开源
86 StepFunAI Logo 未公布 67.10 未公布 3,210 免费商用授权
87 DeepSeek-AI Logo
DeepSeek-V3.1
thinking
未公布 74.80 未公布 6,710 免费商用授权
88 阿里巴巴 Logo 未公布 74.10 未公布 2,350 免费商用授权
89 阿里巴巴 Logo 未公布 74.10 未公布 305 免费商用授权
90 DeepSeek-AI Logo 未公布 74.10 未公布 6,710 免费商用授权
91 Moonshot AI Logo 未公布 73.80 未公布 未知 不开源
92 Anthropic Logo 未公布 71.00 未公布 未知 不开源
93 阿里巴巴 Logo
Qwen3-235B-A22B
thinking
未公布 70.70 未公布 2,350 免费商用授权
94 xAI Logo 未公布 70.60 未公布 未知 不开源
95 OpenAI Logo 未公布 67.40 未公布 未知 不开源
96 阿里巴巴 Logo 未公布 65.60 未公布 未知 免费商用授权
97 智谱AI Logo 未公布 51.80 未公布 90 免费商用授权
98 Google Deep Mind Logo 未公布 24.60 未公布 120 免费商用授权
99 DeepMind Logo 未公布 28.90 未公布 未知 不开源
100 阿里巴巴 Logo 未公布 29.00 未公布 305 免费商用授权
101 Facebook AI研究实验室 Logo 未公布 32.80 未公布 1,090 免费商用授权
102 阿里巴巴 Logo 未公布 35.10 未公布 40 免费商用授权
103 OpenAI Logo 未公布 35.80 未公布 未知 不开源
104 百度 Logo 未公布 38.80 未公布 3,000 免费商用授权
105 百度 Logo 未公布 38.80 未公布 4,240 免费商用授权
106 阿里巴巴 Logo 未公布 43.20 未公布 305 免费商用授权
107 Facebook AI研究实验室 Logo 未公布 43.40 未公布 4,000 免费商用授权
108 Anthropic Logo 未公布 48.50 未公布 未知 不开源
109 Facebook AI研究实验室 Logo 未公布 49.40 未公布 20,000 免费商用授权
110 阿里巴巴 Logo 未公布 51.80 未公布 2,350 免费商用授权
111 MiniMaxAI Logo
MiniMax M2
thinking
未公布 83.00 未公布 2,300 免费商用授权
112 DeepSeek-AI Logo 未公布 55.00 未公布 6,710 免费商用授权
113 OpenAI Logo
GPT-5-mini
thinking
未公布 55.00 未公布 未知 不开源
114 阿里巴巴 Logo 未公布 55.20 未公布 40 免费商用授权
115 MistralAI Logo 未公布 55.84 未公布 240 免费商用授权
116 阿里巴巴 Logo 未公布 56.60 未公布 800 免费商用授权
117 Tencent ARC Logo 未公布 57.00 未公布 70 免费商用授权
118 阿里巴巴 Logo
Qwen3-8B
thinking
未公布 57.50 未公布 80 免费商用授权
119 MistralAI Logo 未公布 59.36 未公布 未知 不开源
120 华为 Logo 未公布 59.60 未公布 719 免费商用授权
121 阿里巴巴 Logo 未公布 61.80 未公布 80 免费商用授权
122 Anthropic Logo
Haiku 4.5
thinking
未公布 62.00 未公布 未知 不开源
123 腾讯AI实验室 Logo 未公布 63.90 未公布 800 免费商用授权
124 腾讯AI实验室 Logo 未公布 64.90 未公布 未知 不开源
125 阿里巴巴 Logo 未公布 未公布 73.20 未知 不开源
126 xAI Logo 未公布 未公布 88.40 2,690 免费商用授权
127 Anthropic Logo 未公布 未公布 88.10 未知 不开源
128 Google Deep Mind Logo 未公布 29.70 87.80 270 免费商用授权
129 OpenAI Logo 未公布 未公布 87.20 未知 不开源
130 MistralAI Logo 未公布 37.90 86.60 未知 不开源
131 Anthropic Logo 未公布 未公布 84.90 未知 不开源
132 MistralAI Logo 未公布 31.50 81.10 220 不可以商用
133 Facebook AI研究实验室 Logo 未公布 33.30 80.50 700 免费商用授权
134 Microsoft Azure Logo 未公布 未公布 74.40 38 免费商用授权
135 xAI Logo 未公布 未公布 74.10 未知 不开源
136 Facebook AI研究实验室 Logo 未公布 33.30 88.40 700 免费商用授权
137 Facebook AI研究实验室 Logo 未公布 未公布 66.50 80 免费商用授权
138 CohereAI Logo 未公布 未公布 62.20 320 不可以商用
139 阿里巴巴 Logo 未公布 未公布 59.10 727 免费商用授权
140 阿里巴巴 Logo 未公布 未公布 57.90 70 免费商用授权
141 Moonshot AI Logo 未公布 未公布 48.10 160 免费商用授权
142 阿里巴巴 Logo 未公布 未公布 42.10 30 免费商用授权
143 Google Research Logo 未公布 未公布 37.80 90 免费商用授权
144 Facebook AI研究实验室 Logo 未公布 未公布 33.50 80 免费商用授权
145 MistralAI Logo 未公布 未公布 29.30 70 免费商用授权
146 Facebook AI研究实验室 Logo 未公布 未公布 28.00 32 免费商用授权
147 Google Deep Mind Logo
Gemini 2.5 Deep Think
deeper_thinking
未公布 87.60 未公布 未知 不开源
148 xAI Logo 未公布 79.40 未公布 未知 不开源
149 DeepSeek-AI Logo 未公布 80.00 未公布 6,710 免费商用授权
150 xAI Logo
Grok 4 Fast
thinking
未公布 80.00 未公布 未知 不开源
151 Google Deep Mind Logo 未公布 80.40 未公布 未知 不开源
152 xAI Logo
Grok 4.1 Fast
thinking
未公布 82.00 未公布 未知 不开源
153 智谱AI Logo
GLM-4.6
thinking
未公布 82.80 未公布 3,550 免费商用授权
154 阿里巴巴 Logo 未公布 未公布 19.00 325 免费商用授权
155 Moonshot AI Logo
Kimi K2 Thinking
thinking
未公布 83.10 未公布 10,400 免费商用授权
156 智谱AI Logo
GLM-4.7
thinking
未公布 84.90 未公布 3,580 免费商用授权
157 Anthropic Logo
Claude Opus 4.5
thinking + 使用工具
未公布 87.00 未公布 未知 不开源
158 Google Deep Mind Logo 未公布 77.10 未公布 未知 不开源
159 OpenAI Logo 未公布 52.00 92.40 未知 不开源
160 Anthropic Logo 未公布 未公布 92.00 未知 不开源
161 腾讯AI实验室 Logo 未公布 32.00 91.00 未知 不开源
162 OpenAI Logo 未公布 未公布 90.20 未知 不开源
163 Google Deep Mind Logo 未公布 未公布 89.00 未知 不开源
164 Facebook AI研究实验室 Logo 未公布 30.20 89.00 4,050 免费商用授权
165 亚马逊 Logo 未公布 未公布 89.00 未知 不开源
166 DeepSeek-AI Logo 未公布 34.60 89.00 6,810 免费商用授权
167 MistralAI Logo 未公布 未公布 88.41 240 免费商用授权
168 阿里巴巴 Logo 未公布 51.20 88.40 320 免费商用授权
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.90
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 77.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 85.00
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.20
LiveCodeBench (编程与软件工程) 92.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.30
LiveCodeBench (编程与软件工程) 85.90
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.40
LiveCodeBench (编程与软件工程) 86.40
HumanEval (编程与软件工程) 未公布
参数(亿) 1,960
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 3,580
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 73.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 72.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.50
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 71.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.40
LiveCodeBench (编程与软件工程) 85.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.20
LiveCodeBench (编程与软件工程) 83.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.60
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.40
LiveCodeBench (编程与软件工程) 74.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 56.00
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 84.50
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 67.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 4,800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 66.00
LiveCodeBench (编程与软件工程) 56.40
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 64.80
LiveCodeBench (编程与软件工程) 59.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 64.20
LiveCodeBench (编程与软件工程) 72.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 63.80
LiveCodeBench (编程与软件工程) 70.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 63.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 61.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.60
LiveCodeBench (编程与软件工程) 51.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 59.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 310
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 58.60
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 73.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 56.00
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 55.60
LiveCodeBench (编程与软件工程) 62.30
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 54.60
LiveCodeBench (编程与软件工程) 40.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 54.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 53.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.80
LiveCodeBench (编程与软件工程) 53.70
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 50.00
LiveCodeBench (编程与软件工程) 41.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.30
LiveCodeBench (编程与软件工程) 69.50
HumanEval (编程与软件工程) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.20
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 49.00
LiveCodeBench (编程与软件工程) 38.70
HumanEval (编程与软件工程) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 55.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 46.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 40.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 38.80
LiveCodeBench (编程与软件工程) 49.20
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 38.00
LiveCodeBench (编程与软件工程) 46.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 34.40
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 34.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 31.00
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 27.60
LiveCodeBench (编程与软件工程) 34.30
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 23.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 22.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 21.40
LiveCodeBench (编程与软件工程) 29.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 75.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.70
HumanEval (编程与软件工程) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 66.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.80
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 73.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 24.60
HumanEval (编程与软件工程) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 28.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.00
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.80
HumanEval (编程与软件工程) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.20
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.40
HumanEval (编程与软件工程) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 48.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 49.40
HumanEval (编程与软件工程) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.00
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.20
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.84
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.00
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.36
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.60
HumanEval (编程与软件工程) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 61.80
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 62.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 63.90
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 64.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.40
参数(亿) 2,690
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.70
HumanEval (编程与软件工程) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 37.90
HumanEval (编程与软件工程) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 31.50
HumanEval (编程与软件工程) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 79.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.10
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 84.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,580
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 52.00
HumanEval (编程与软件工程) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.00
HumanEval (编程与软件工程) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 30.20
HumanEval (编程与软件工程) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 34.60
HumanEval (编程与软件工程) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.20
HumanEval (编程与软件工程) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情