DeepSeek-R1

推理大模型

DeepSeek-R1

发布时间: 2025-01-20

1,506

GitHub Hugging Face 在线体验

模型参数（Parameters）

6710.0

最高上下文长度（Context Length）

128K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

暂无数据

模型类型

推理大模型

发布时间

2025-01-20

模型预文件大小

134GB

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License - 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/deepseek-ai/DeepSeek-R1

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

DeepSeek_R1.pdf

DataLearnerAI博客

什么是推理大模型？DeepSeek R1推理大模型与DeepSeek V3模型的区别是什么？什么时候该使用推理大模型？

API接口信息

接口速度（满分5分）

暂无数据

接口价格

暂无公开的 API 定价信息。

DeepSeek-R1模型在各大评测榜单的评分

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU default

90.80

5 / 59

MMLU Pro default

28 / 114

GPQA Diamond default

71.50

87 / 161

LiveBench default

69.41

22 / 52

ARC-AGI default

15.80

43 / 50

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

SimpleQA default

30.10

21 / 44

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

LiveCodeBench default

65.90

45 / 104

SWE-bench Verified default

49.20

78 / 92

数学推理

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

MATH-500 default

97.30

12 / 42

AIME 2024 default

79.80

29 / 62

AIME2025 default

76 / 108

写作和创作

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

Creative Writing default

84.60

11 / 22

发布机构

DeepSeek-AI

查看发布机构详情

DeepSeek-R1模型解读

DeepSeekAI发布的推理大模型，是接近OpenAI o1推理大模型的开源版本，完全免费开源，性能强悍，是基于DeepSeek R1 Zero基础上微调后得到的。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯