Qwen3-8B

推理大模型

Qwen3-8B

发布时间: 2025-04-28

2,778

GitHub Hugging Face 在线体验

模型参数（Parameters）

80.0

最高上下文长度（Context Length）

128K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

129024 tokens

模型类型

推理大模型

发布时间

2025-04-28

模型预文件大小

16GB

思考模式

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0 - 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3

Hugging Face

https://huggingface.co/Qwen/Qwen3-8B

在线体验

https://chat.qwen.ai/

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

重磅！阿里开源第三代千问大模型：Qwen3系列，最小仅6亿参数规模，最大2350亿参数规模大模型！

API接口信息

接口速度（满分5分）

接口价格

默认单位：$/100万 tokens；若计费单位不同，则以供应商公开的原始标注为准。

标准计费 Standard

模态	输入	输出
文本	0.18 美元/100 万tokens	2.1 美元/100 万tokens

Qwen3-8B模型在各大评测榜单的评分

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU Pro default

72.50

74 / 114

GPQA Diamond default

148 / 161

GPQA default

3 / 13

GPQA Diamond default

39.30

148 / 161

数学推理

共 6 项评测

评测名称 / 模式

得分

排名/总模型数

MATH-500 default

97.40

38 / 42

MATH-500 default

87.40

38 / 42

AIME 2024 default

79.40

36 / 62

AIME 2024 default

36 / 62

AIME2025 default

67.30

107 / 108

AIME2025 default

20.90

107 / 108

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

LiveCodeBench default

61.80

59 / 104

LiveCodeBench default

57.50

59 / 104

写作和创作

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

Creative Writing default

22 / 22

Creative Writing default

64.50

22 / 22

发布机构

阿里巴巴

查看发布机构详情

Qwen3-8B模型解读

Qwen3-8B是阿里开源的80亿参数规模的大模型，是第三代千问大模型。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯