Ge

Gemma 3 - 27B (IT)

聊天大模型

Gemma 3 - 27B (IT)

发布时间: 2025-03-12

937
模型参数(Parameters)
270.0
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

128K tokens

最长输出结果
暂无数据
模型类型

聊天大模型

发布时间

2025-03-12

模型预文件大小

54.8GB

开源和体验地址

代码开源状态
预训练权重开源
Gemma Terms of Use - 免费商用授权
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验
暂无在线体验地址

API接口信息

接口速度(满分5分)
暂无数据
接口价格
暂无公开的 API 定价信息。

Gemma 3 - 27B (IT)模型在各大评测榜单的评分

综合评估

共 4 项评测
MMLU normal
76.90
49 / 59
MMLU Pro normal
67.50
77 / 107
GPQA Diamond normal
42.40
118 / 135
GPQA normal
36.83
12 / 13

编程与软件工程

共 3 项评测
HumanEval normal
87.80
17 / 36
MBPP normal
74.40
16 / 27
LiveCodeBench normal
29.70
94 / 98

数学推理

共 2 项评测
MATH normal
89
6 / 41
AIME 2024 normal
25.30
57 / 62

常识问答

共 1 项评测
SimpleQA normal
10
38 / 43

发布机构

Gemma 3 - 27B (IT)模型解读

Gemma 3 - 27B Instruct是Google的第三代Gemma大模型,27亿参数,指令优化版本。Gemma系列是Google开源的系列大模型,基座模型为Google的Gemini,Gemini是闭源版本。Gemma 3 - 27B Instruct在2025年3月12日出现在Google AI Studio上,开发者可以免费使用。


该模型最多支持8K的输出,输入准确来说131072个tokens。


关于Gemma开源系列模型介绍: https://www.datalearner.com/blog/1051708523708257 


Gemma3-27B 是 Google DeepMind 在 Gemma 3 系列中规模最大、性能最强的版本。相比 12B 版本,它在复杂任务上的表现更为出色,并在多个基准测试中达到或接近 Gemini 1.5 Pro 的水平。该模型支持 128K tokens 长上下文,配备 417M 参数的视觉编码器,在文本生成、代码理解、多模态任务等方面均表现优异。

模型架构与设计

Gemma3-27B 采用 解码器 Transformer 架构,结合 Grouped-Query Attention (GQA) 以优化计算效率,并通过 5:1 的局部/全局注意力交替 机制降低 KV 缓存占用,使其在长文本推理方面具备显著优势。同时,它集成了 SigLIP 视觉编码器,支持 OCR、文档理解等任务。

训练细节

该模型在 TPUv5p 平台 训练,采用 6144 个 TPU,24 数据切分、8 序列切分、32 副本。使用 14T tokens 进行训练,并通过 知识蒸馏 提高性能。此外,后训练阶段采用强化学习优化数学、推理、指令跟随等能力,使其在各类任务上均表现出色。

参数配置

模型版本视觉编码器参数嵌入参数非嵌入参数上下文长度
Gemma3‑12B417M1012M10759M128K tokens
Gemma3‑27B417M1416M25600M128K tokens

基准测试表现

Gemma3-27B 在多个评测中均取得了优异的成绩,接近甚至超越部分封闭大模型,特别是在 MMLU、数学推理、代码生成等方面。

评测基准Gemma3-4BGemma3-12BGemma3-27BGemini 1.5 Pro
MMLU-Pro43.660.667.579.1
LiveCodeBench12.624.629.736.0
Bird-SQL36.347.954.459.3
GPQA Diamond30.840.942.464.7
SimpleQA4.06.310.044.3
MATH75.683.889.091.8

Gemma3-27B 在 LMSYS Chatbot Arena 评测中的排名

在 LMSYS Chatbot Arena 的人类评测中,Gemma3-27B-IT 获得 1338 Elo,位列 前 10,超过 DeepSeek-V3、LLaMA 3 70B、Qwen2.5-70B 等大规模模型,仅次于封闭大模型 GPT-4.5、Gemini-2.0-Pro 等。

排名模型名称Elo 分数参数规模
1Grok-3-Preview-02-241412-
1GPT-4.5-Preview1411-
3Gemini-2.0-Pro-Exp1380-
6DeepSeek-R11363671B/37B
9Gemma3-27B-IT133827B
14Claude 3.7 Sonnet1309-
18Gemini-1.5-Pro-0021302-

模型特点

  • 长文本理解:支持 128K tokens 上下文,在复杂推理任务中表现稳定。
  • 强大的多模态能力:集成视觉编码器,支持 OCR、文档理解等任务。
  • 接近封闭大模型的性能:在多个基准测试中,表现接近 Gemini 1.5 Pro,同时在 LMSYS 评测中位列开源模型前列。

总结

Gemma3-27B 是 Google DeepMind 迄今最强大的开源模型,在多个评测中接近封闭大模型,适用于复杂文本推理、代码生成、多模态任务等高端应用。对于需要最先进 LLM 性能的研究者和开发者来说,它是当前最值得关注的开源选择之一。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat