Google 的 Nano Banana 2 Lite 和 Gemini Omni Flash 已上线,可为开发者提供更快、更具成本效益的 AI 图像和视频生成功能。
Google 于 2026 年 6 月 30 日推出了两款新的 AI 工具:Nano Banana 2 Lite 和 Gemini Omni Flash,旨在简化开发者的多媒体创建和编辑。这些更新是 Google DeepMind Gemini AI 套件的一部分,重点关注图像和视频工作流程的速度、成本效益和易用性。
Nano Banana 2 Lite,品牌为 Gemini 3.1 Flash Lite Image,是 2026 年 2 月发布的 Nano Banana 2 模型的更快、更具成本效益的变体。这种轻量级模型面向寻求高吞吐量、实时图像生成而不牺牲质量的开发人员。每张图像的延迟仅为 4 秒,每 1,000 张图像的成本为 0.034 美元,专为快速原型设计和注重预算的工作流程而构建。 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 等关键平台已支持该模型,并与搜索 AI 模式和 Google Photos 等面向消费者的工具集成,同时推出。
性能基准测试显示 Nano Banana 2 Lite 在交互式用例中表现出色,可提供快速的依从性、字符一致性和可读的图像内文本。 Google 将其定位为原始 Nano Banana 2.5 Flash Image 的替代品,强调其卓越的效率和可扩展性,适合需要快速迭代或管理运营成本的开发人员。
与此同时,开发者现在可以通过同一平台使用Gemini Omni Flash,这是一种用于视频生成和对话式编辑的多模式人工智能工具。该模型使用户能够通过组合文本、图像和现有视频剪辑等输入来创建高质量视频。它的价格为每秒视频输出 0.10 美元,与视频 AI 领域的竞争对手 Veo 3.1 Fast 的成本相当。 Omni Flash 的突出功能包括使用自然语言命令进行对话式视频编辑、文本和视频动作的无缝同步,以及利用现实世界知识来讲述故事和场景构建的能力。
Omni Flash 目前支持 10 秒视频输出,未来更新预计会提供更长的持续时间。尽管音频参考和扩展场景连续性等一些功能仍在开发中,但该模型为希望集成人工智能驱动的视频工作流程的开发人员提供了一个引人注目的工具。
真正的创新在于将两种模型结合起来。开发人员可以使用 Nano Banana 2 Lite 生成图像,并将其用作 Gemini Omni Flash 中的参考来制作动画剪辑,从而实现端到端的创意工作流程。 Google 通过 Anywhere 和 Space Lift 等演示应用展示了这种协同作用。Anywhere 将自拍照转变为具有里程碑意义的动画,Space Lift 则通过人工智能驱动的设计和电影视频预览重新构想了室内设计。
两种模型都集成了 SynthID 水印以进行内容身份验证,从而强化了 Google 对 AI 生成媒体的安全性和透明度的承诺。从今天开始,开发人员可以通过 Google AI Studio 和 Gemini API 访问这些工具。随着人工智能在创意产业中的作用日益增强,这些版本突显了 Google 对可扩展、可访问的生成媒体解决方案的关注。
