Amazon Nova 2 Omni(Preview)
支持
1000K tokens
多模态大模型
2025-12-02
Amazon Nova 2 Omni(预览)为“统一多模态推理与生成”模型:同时支持文本、图像、视频、语音输入,并可输出文本与图像(同一模型内)。其目标是以单一模型覆盖跨模态理解、图像生成/编辑与语音转写等能力,降低对多模型编排的依赖与复杂度。
2025-12-02 公布预览,定位为业界首批在同一推理模型中同时支持“多模态输入 + 文本/图像双输出”的方案之一。
系列文档说明支持最长约 100 万 tokens 的上下文,具备内置工具与远程工具能力(含 MCP)。
输入:文本/图像/视频/语音;输出:文本与图像。适用场景包括:大规模产品/媒体资产分析、品牌与风格一致性生成、多数据源跨模态检索与内容合成。
通过 Amazon Bedrock API(预览);专有托管,未开源。
关注DataLearnerAI微信公众号,接受最新大模型资讯