Cl

Claude Opus 4

推理大模型

Claude Opus 4

发布时间: 2025-05-23

943
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
200K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

200K tokens

最长输出结果

32000 tokens

模型类型

推理大模型

发布时间

2025-05-23

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 15 美元/ 100万tokens 75 美元/100万tokens
图片 15 美元/ 100万tokens --

Claude Opus 4模型在各大评测榜单的评分

综合评估

共 5 项评测
MMLU Pro normal
85
11 / 107
GPQA Diamond normal
79.60
41 / 135
ARC-AGI normal
35.70
20 / 34
HLE normal
10.70
50 / 72
ARC-AGI-2 normal
8.60
9 / 24

编程与软件工程

共 2 项评测
72.50
18 / 68
LiveCodeBench normal
56.60
56 / 98

数学推理

共 8 项评测
MATH-500 normal
98.20
3 / 42
AIME 2024 normal
76
36 / 62
AIME2025 normal
75.50
54 / 95
FrontierMath normal
4.50
29 / 50
4.20
7 / 27
FrontierMath thinking
4.10
31 / 50
IMO-ProofBench thinking
2.90
16 / 16
0.01
20 / 27

写作和创作

共 1 项评测
83.75
13 / 22

常识推理

共 1 项评测
Simple Bench thinking
58.80
7 / 25

Agent能力评测

共 3 项评测
τ²-Bench thinking + 使用工具
72.50
10 / 26
Aider-Polyglot thinking
72
8 / 22
70.10
11 / 22

发布机构

Claude Opus 4模型解读

Anthropic 近日推出了 Claude Opus 4,这是其迄今为止最智能的模型,旨在推动编码、代理搜索和创意写作领域的界限。作为 Claude 模型家族中的旗舰产品,Opus 4 代表了人工智能在复杂推理和自主工作方面的显著进步。

核心能力与应用场景

Claude Opus 4 被设计为一种混合推理模型,能够提供即时响应,也能进行分步思考,并通过用户友好的摘要展示其推理过程。对于 API 用户,该模型提供了对思考预算的精细控制,以优化成本和性能。其主要应用场景包括:

      关键特性与性能

      Claude Opus 4 在多项基准测试中取得了业界领先的成果,包括编码方面的 SWE-bench,以及 MMLU、GPQA 和 Aider Polyglot。它还以卓越的写作能力超越了之前的 Claude 模型,为自然、类人散文设定了新标准。该模型拥有一个 200K 的上下文窗口。Anthropic 还特别提到,Opus 4 使得在后台运行 Claude Code 成为可能,允许开发者分配长时间运行的编码任务,由 Opus 独立处理。

      可用性与定价

      Claude Opus 4 面向需要与 Anthropic 最强大模型协作处理复杂任务的商业用户和消费者,可通过 Claude for Pro、Max、Team 和 Enterprise 用户获得。对于有兴趣构建需要前沿智能的 AI 解决方案的开发者,Claude Opus 4 可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。定价方面,Claude Opus 4 的输入 token 价格为每百万美元 15 美元,输出 token 价格为每百万美元 75 美元,通过即时缓存可节省高达 90% 的成本,通过批量处理可节省 50% 的成本。

      关注DataLearnerAI公众号

      关注DataLearnerAI微信公众号,接受最新大模型资讯

      DataLearnerAI WeChat