Gemini 2.5 Flash-Lite-Preview-09-2025
支持
1000K tokens
65536 tokens
聊天大模型
2025-09-25
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0.1 美元/100 万tokens | 0.4 美元/100 万tokens |
| 图片 | 0.1 美元/100 万tokens |
Gemini 2.5 Flash-Lite-Preview-09-2025 是 Gemini 模型家族中专注于超低延迟、高并发和最高性价比的一个子模型。它是为那些对延迟和成本有极其严格要求的任务而设计。
Flash-Lite 版本是在保持 Gemini 2.5 Flash 核心能力的基础上,通过进一步的优化来追求极致的效率,其核心定位是:
与 Gemini 2.5 Flash 09-2025 的更新类似,Flash-Lite 预览版也在效率方面进行了加强:
Gemini 2.5 Flash-Lite 适用于以下需要“速度优先”的场景:
| 类别 | 典型应用 |
|---|---|
| 实时交互 | 快速响应的聊天机器人、客户服务系统中的即时回复。 |
| 大规模数据处理 | 需要在极短时间内对海量数据进行分类、过滤或标签化的任务。 |
| 高并发 API 调用 | 网站或应用后端对模型的 API 调用频率极高,对每秒事务数(TPS)要求严格。 |
| 轻量级智能体 | 需要快速使用 Function Calling(函数调用)来执行简单但关键操作的 Agentic 任务。 |
gemini-2.5-flash-lite-preview-09-2025 模型字符串在 Google AI Studio 和 Vertex AI 上进行测试。-latest 别名 (gemini-flash-lite-latest),始终指向该系列最新的优化版本,方便开发者持续进行试验。简而言之,Gemini 2.5 Flash-Lite 是为追求极致速度和最低成本的开发者提供的版本,它在效率上做到了最优,同时保持了执行核心智能任务的能力。
关注DataLearnerAI微信公众号,接受最新大模型资讯