OpenAI o3-mini (high)

推理大模型

发布时间: 2025-01-31

878

GitHub Hugging Face 在线体验

模型参数（Parameters）

未披露

最高上下文长度（Context Length）

128k

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128k tokens

最长输出结果

暂无数据

模型类型

推理大模型

发布时间

2025-01-31

模型预文件大小

暂无数据

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源 - 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

OpenAI o3-mini

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

暂无数据

接口价格

暂无公开的 API 定价信息。

OpenAI o3-mini (high)模型在各大评测榜单的评分

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU default

86.90

22 / 59

GPQA Diamond default

79.70

63 / 161

ARC-AGI default

34.50

37 / 50

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

HumanEval default

97.60

1 / 36

LiveCodeBench default

69.50

40 / 104

SWE-bench Verified default

49.30

77 / 92

数学推理

共 5 项评测

评测名称 / 模式

得分

排名/总模型数

MATH default

97.90

1 / 41

MATH-500 default

97.90

9 / 42

AIME 2024 default

18 / 62

FrontierMath default

21 / 58

FrontierMath - Tier 4 default

4.20

18 / 38

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

SimpleQA default

13.80

34 / 44

发布机构

OpenAI

查看发布机构详情

OpenAI o3-mini (high)模型解读

OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1，跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。

o3 mini总共分为三个版本，o3-mini low，o3-mini medium 和o3-mini high。本模型为其中最强的版本，即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时，根据测试，这个版本的模型也比之前的o1更强。

不同版本的评测结果如下：

Category	01-mini	03-mini (low)	03-mini (medium)	03-mini (high)
General	85.2	84.9	85.9	86.9
Math	90.0	95.8	97.3	97.9
Factuality	89.9	55.1	90.8	92.0
Eval	76.0	13.0	13.4	13.8

Model	Reasoning Level	Average	LCB Generation	Code Completion
o3-mini	low	0.618	0.756	0.48
o3-mini	medium	0.723	0.846	0.60
o3-mini	high	0.846	0.820	0.833
o1-mini	high	0.674	0.628	0.72

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯