Qwen2.5-3B

基础大模型

Qwen2.5-3B

发布时间: 2024-09-18

918

GitHub Hugging Face 在线体验

模型参数（Parameters）

30.0

最高上下文长度（Context Length）

32K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

32K tokens

最长输出结果

暂无数据

模型类型

基础大模型

发布时间

2024-09-18

模型预文件大小

6GB

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Tongyi Qianwen RESEARCH LICENSE AGREEMENT - 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen2.5

Hugging Face

https://huggingface.co/Qwen/Qwen2.5-3B

在线体验

暂无在线体验地址

官方介绍与博客

官方论文

Qwen2.5-LLM: Extending the boundary of LLMs

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度（满分5分）

暂无数据

接口价格

暂无公开的 API 定价信息。

Qwen2.5-3B模型在各大评测榜单的评分

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU default

65.60

57 / 59

BBH default

56.30

14 / 18

MMLU Pro default

34.60

111 / 114

GPQA Diamond default

24.30

158 / 161

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

GSM8K default

79.10

16 / 24

MATH default

42.60

37 / 41

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

MBPP default

57.10

23 / 27

HumanEval default

42.10

31 / 36

发布机构

阿里巴巴

查看发布机构详情

Qwen2.5-3B模型解读

Qwen2.5-3B是阿里巴巴开源的30亿参数规模的大语言模型。属于当前业界认为的可以在移动端运行的最高尺寸的大语言模型。该模型常规版本的文件大小为6GB，可以在手机端运行。该模型与阿里巴巴开源的其它2.5代模型最大的差异是开源协议不同。它的开源协议是Qwen Research协议，该开源协议是不允许商用的。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯