Op

OpenAI o3-mini (high)

推理大模型

OpenAI o3-mini (high)

发布时间: 2025-01-31

616
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
128k
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128k tokens

最长输出结果
暂无数据
模型类型

推理大模型

发布时间

2025-01-31

模型预文件大小
暂无数据

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
暂无数据
接口价格
暂无公开的 API 定价信息。

OpenAI o3-mini (high)模型在各大评测榜单的评分

综合评估

共 3 项评测
MMLU normal
86.90
22 / 59
GPQA Diamond normal
79.70
40 / 135
ARC-AGI normal
34.50
21 / 34

编程与软件工程

共 3 项评测
HumanEval normal
97.60
1 / 36
LiveCodeBench normal
69.50
34 / 98
49.30
55 / 68

数学推理

共 5 项评测
MATH normal
97.90
1 / 41
MATH-500 normal
97.90
9 / 42
AIME 2024 normal
87
18 / 62
11
13 / 50
4.20
7 / 27

常识问答

共 1 项评测
SimpleQA normal
13.80
33 / 43

发布机构

OpenAI o3-mini (high)模型解读

OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1,跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。


o3 mini总共分为三个版本,o3-mini low,o3-mini medium 和o3-mini high。本模型为其中最强的版本,即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时,根据测试,这个版本的模型也比之前的o1更强。


不同版本的评测结果如下:

Category01-mini03-mini (low)03-mini (medium)03-mini (high)
General85.284.985.986.9
Math90.095.897.397.9
Factuality89.955.190.892.0
Eval76.013.013.413.8



ModelReasoning LevelAverageLCB GenerationCode Completion
o3-minilow0.6180.7560.48
o3-minimedium0.7230.8460.60
o3-minihigh0.8460.8200.833
o1-minihigh0.6740.6280.72


关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat