AI模型性能对比
选择您感兴趣的模型和评测数据集,或直接查看热门对比组合
至少选择2个模型,如果没有选择任何评测基准,则默认选择最多8个公共评测基准进行对比
1. 选择模型 (已选: 0)
2. 选择评测 (已选: 0)
热门大模型对比
【数据对比】Stepfun-Flash-3.5 vs Kimi-k2.5 vs Qwen3-Max,谁才是 2026 开年的性价比之王?
深入解析 Stepfun-Flash-3.5 的极致推理效率、Kimi-k2.5 的工程逻辑深度与 Qwen3-Max 的全能基准表现,揭示国产大模型在‘快’与‘强’之间的最新平衡。
Kimi K2.5和Qwen3-Max-Thinking哪个更强?Kimi K2.5和Qwen3-Max-Thinking评测对比
Kimi K2.5和Qwen3-Max-Thinking哪个更强?Kimi K2.5和Qwen3-Max-Thinking评测对比
国产最新2大开源模型对比:MiniMax M2.1 v.s. GLM 4.7
2025年最后一个月国产最新2大开源模型小幅升级版本对比:MiniMax M2.1 v.s. GLM 4.7
Gemini 3.0 Flash 与 上一代Gemini 2.5 Pro和Gemini 3.0 Pro对比
Gemini 3.0 Flash比前代Gemini 2.5 Pro的对比
Claude Haiku 4.5与Claude 4 Sonnet和Claude Sonnet 4.5的对比
Claude Haiku 4.5与Anthropic的前代模型对比
DeepSeek V3.1与DeepSeek V3、DeepSeek-R1对比
最新DeepSeek-V3.1和前代DeepSeek-V3和DeepSeek-R1的评测对比
Qwen3-235B-A22B与GPT OSS 120B模型对比
中美最强开源大模型对比
GPT-5与Gemini-2.5-Pro、Grok 4模型对比
GPT-5、Gemini 2.5 Pro和Gro4三大模型对比