Claude Sonnet 4
支持
200K tokens
64000 tokens
推理大模型
2025-05-23
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 3 美元/ 100万tokens | 15 美元/100万tokens |
| 图片 | 3 美元/ 100万tokens |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 3.75 美元/ 100万tokens | 0.3 美元/ 100万tokens |
| 图片 | 3.75 美元/ 100万tokens |
Claude Sonnet 4是Anthropic Claude系列的第四代中型模型,与旗舰级Claude Opus 4一同亮相,取代了前代Sonnet 3.7。 该模型针对需要高效处理复杂任务的场景优化,强调“混合模式”:用户可选择近即时响应或启用“扩展思考”以进行深度推理。这种设计旨在解决前代模型在工具集成和连续任务处理上的痛点,同时保持较低的计算成本。
Sonnet 4的定位并非追求绝对顶尖性能(如Opus 4),而是提供性能与速度的折衷方案,适用于软件开发、代理构建和问题求解等领域。 Anthropic强调,该模型在减少“捷径行为”(如绕过复杂指令的倾向)方面取得了显著进步,据内部测试,相比Sonnet 3.7降低了65%。
Sonnet 4引入多项实用功能,提升了其实用性和可控性:
这些改进使Sonnet 4在代理式任务(如AI代理构建)和软件工程场景中表现出色,但也继承了Claude系列的安全导向设计,优先避免有害输出。
Anthropic公布的基准数据显示,Sonnet 4在多个关键指标上达到了当时行业领先水平,尤其在无扩展思考模式下已具竞争力。以下是部分核心基准(基于官方数据):
| 基准测试 | Sonnet 4 分数(无扩展思考) | 备注 |
|---|---|---|
| SWE-bench Verified | 72.7% | 真实软件工程任务;高计算变体达80.2% |
| GPQA Diamond | 70.0% | 复杂问题求解 |
| MMMLU | 85.4% | 多模态多语言理解 |
| MMMU | 72.6% | 多模态多任务理解 |
| AIME | 33.1% | 高级数学问题 |
第三方测试进一步验证了这些成绩。例如,在SWE-bench上,Sonnet 4略微超越Opus 4(72.7% vs. 72.5%),显示其在编码效率上的优势。 Reddit用户的一项对比实验显示,Sonnet 4在执行复杂任务时比Google的Gemini 2.5 Pro快2.8倍,并实现100%完成率。 然而,一些独立评论指出,其在纯数学基准(如AIME)上的表现仍落后于竞争对手,表明Sonnet 4更适合应用导向而非纯理论任务。
Sonnet 4自发布起即广泛可用,支持Claude.ai网页端、API接口,以及Amazon Bedrock和Google Cloud Vertex AI平台。 免费用户可访问基本功能,而Pro、Team和Enterprise计划用户可解锁扩展思考模式。定价维持Sonnet系列标准:输入3美元/百万tokens,输出15美元/百万tokens。
此外,Anthropic推出了Claude Code工具集成,支持VS Code、JetBrains和GitHub Actions,进一步便利开发者工作流。 这一生态布局增强了Sonnet 4的实际部署价值,尤其在企业环境中。
市场反应积极,《时代》杂志将Sonnet 4列入“2025年最佳发明”,赞扬其通用性与用户友好度,用户反馈显示其快速被采用于日常AI任务。 Medium上的早期评论认为,虽然Sonnet 4在奖励黑客行为(模型作弊)上改进显著,但整体性能提升并非“压倒性”。 DataCamp的分析强调,其在真实世界编码测试中的表现使其成为中型模型的基准。
值得注意的是,Sonnet 4的局限性包括不如Opus 4在深度领域强大,以及思考摘要机制可能在复杂提示工程中限制透明度。 这些反馈反映了AI模型开发的权衡:安全与效率往往需在性能前沿上让步。
Claude Sonnet 4并非2025年AI领域的唯一焦点,但其在平衡创新与实用性方面的努力,使其成为Anthropic生态中的可靠支柱。对于开发者而言,这是一个值得测试的工具,尤其在编码和代理任务中;对于企业,则提供了一个高效的升级路径。随着后续版本如Sonnet 4.5的出现, Sonnet 4的遗产可能更多体现在奠基作用上。总体而言,它强化了Anthropic在负责任AI领域的声誉,而非单纯追求参数规模的竞赛。
参考来源:Anthropic官方公告、DataCamp分析、TIME杂志评选等。更多细节可查阅Anthropic官网。
关注DataLearnerAI微信公众号,接受最新大模型资讯