Ha

Haiku 4.5

多模态大模型

Claude Haiku 4.5

发布时间: 2025-10-15

749
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
200K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

200K tokens

最长输出结果

65536 tokens

模型类型

多模态大模型

发布时间

2025-10-15

模型预文件大小
暂无数据
思考模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 1 美元 / 100万 tokens 5 美元 / 100万 tokens
图片 1 美元 / 100万 tokens --
缓存计费 Cache
模态 输入 Cache 输出 Cache
文本 1.25 美元 / 100万 tokens 0.10 美元 / 100万 tokens
图片 1.25 美元 / 100万 tokens --

Haiku 4.5模型在各大评测榜单的评分

综合评估

共 12 项评测
MMLU Pro default
80
66 / 114
MMLU Pro default
76
66 / 114
GPQA Diamond default
73.30
121 / 161
LiveBench default
71.38
43 / 52
GPQA Diamond default
60.50
121 / 161
LiveBench default
60.42
43 / 52
ARC-AGI default
47.70
44 / 50
ARC-AGI default
14.30
44 / 50
HLE default
9.70
113 / 115
ARC-AGI-2 default
4.50
38 / 42
HLE default
4.30
113 / 115
ARC-AGI-2 default
1.30
38 / 42

编程与软件工程

共 5 项评测
73.30
63 / 92
LiveCodeBench default
62
76 / 104
60.60
63 / 92
LiveCodeBench default
51
76 / 104
39.45
14 / 17

数学推理

共 4 项评测
AIME2025 default
96.30
97 / 108
AIME2025 default
80.70
97 / 108
AIME2025 default
39
97 / 108
FrontierMath default
4.10
39 / 58

AI Agent - 工具使用

共 2 项评测
Terminal-Bench default
41
26 / 35
Terminal-Bench default
26
26 / 35

多模态理解

共 1 项评测
MMMU default
73.20
14 / 20

Agent能力评测

共 1 项评测
τ²-Bench default
33
36 / 36

指令跟随

共 1 项评测
IF Bench default
54.30
21 / 27

发布机构

Claude Haiku 4.5模型解读

Claude Haiku 4.5的详情可以看DataLearnerAI的博客: https://www.datalearner.com/blog/1051760883300903 


Claude Haiku 4.5 由 Anthropic 发布,是 Claude 4.5 系列中主打速度与成本效率的轻量模型,面向实时与高并发应用场景。官方声明其在编码、计算机操作与多代理工作流等任务上的综合表现可与 Sonnet 4 接近,同时具备显著更低的延迟与更优的成本效率。

架构与技术规格(公开信息)

官方未披露参数量与训练数据细节。上下文窗口为 200K tokens。Haiku 4.5 支持文本与图像输入(Text & Image Input),输出为文本。

核心能力与支持模态

(1)文本与代码:面向高并发与低延迟的对话、摘要、代码生成与辅助开发等任务;(2)工具/计算机使用与多代理工作流:强调在复杂工作流中保持稳定响应与自纠错能力;(3)图像理解:支持图像作为输入并进行文本层面的理解与推断(输出为文本)。

性能与基准

官方模型页显示 Haiku 4.5 在 SWE-bench Verified 上得分 73.3%(方法学细节与试验设置见新闻稿附注),并在编码、计算机使用与代理式任务上与 Sonnet 4 保持同级表现。

应用场景与限制

典型应用包括:实时客服/客服代理、低时延对话助手、代码子代理(在多代理系统中的并行子任务执行)、金融数据监控与分析、研究类子代理等。官方系统卡显示该模型在安全评估后以 ASL-2 发布;仍应遵循使用政策并在高风险领域实施必要的人类监督。

访问方式与许可

支持通过 Anthropic API 直接调用(模型名 claude-haiku-4-5),并已在 Amazon Bedrock、Google Cloud Vertex AI 上线。定价(开发者平台)为:$1/百万输入 token$5/百万输出 token;提示词缓存(Prompt Caching)写入 $1.25/百万 token、读取 $0.10/百万 token(5 分钟 TTL)。模型未开源。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat