toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,262个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

Gemini Omni 上手体验:用自然语言对话就能改视频

2026/05/20
·toolin小编

Google 发布 Gemini Omni,支持任意输入生成任意输出,视频编辑和多轮对话式修改是最大亮点,已面向订阅用户上线。

Gemini Omni 上手体验:用自然语言对话就能改视频
Gemini Omni 上手体验:用自然语言对话就能改视频
2026/05/20

Gemini Omni 上手体验:用自然语言对话就能改视频

Google 发布 Gemini Omni,支持任意输入生成任意输出,视频编辑和多轮对话式修改是最大亮点,已面向订阅用户上线。

Gemini Omni 是什么核心能力对话式视频编辑物理模拟知识驱动的视频生成任意素材输入怎么用价格适合谁
AI产品

Google 在 I/O 2026 上发布了 Gemini Omni -- 一个能接受任意输入、生成任意输出的多模态模型。视频生成是它的第一步,但和 Seedance 这类纯视频生成模型不同,Omni 的核心卖点是"对话式视频编辑"。

Gemini Omni 是什么

Gemini Omni 整合了 Google 目前最先进的几款生成式媒体模型:图像模型 Nano Banana、视频生成模型 Veo、以及世界模型 Genie。它不是简单地生成视频,而是理解视频中的物理关系、运动关系和场景逻辑。

DeepMind CEO Demis Hassabis 亲自上台发布,定位是"世界模型"(World Model)。

Gemini Omni 架构

核心能力

对话式视频编辑

这是 Omni 最实用的功能。上传你拍的视频,然后用自然语言告诉它怎么改。不是一次性生成,而是多轮对话,每条指令在前一条基础上继续操作。

演示案例:拍了一段手摸镜子的视频,告诉 Omni "当人触摸镜子时,让镜子像液体一样泛起涟漪,人的手臂变成反光材质"。视频没有被完全重绘,人物动作保留,但镜子的物理状态和手臂材质被精准替换。

关键特性:

  • 角色、环境、物理效果和场景上下文在多轮修改中保持一致
  • 可以修改特定元素,也可以改动整个场景
  • 支持修改环境、角度、风格、细节

物理模拟

Omni 能理解重力、流体力学等物理概念。让它生成"一条在连锁反应轨道上快速滚动的弹珠",它能展现出对动能和重力的精确理解,而不仅仅是视觉上的"看起来像"。

物理模拟效果

知识驱动的视频生成

Omni 能结合 Gemini 的世界知识生成内容。比如输入"生成一个关于蛋白质折叠的黏土动画解释",它会把抽象科学概念转化成带有结构演示的教学视频,而不只是视觉匹配。

知识驱动视频生成

任意素材输入

可以把图片、文本、视频、音频作为参考素材上传,Omni 会理解这些素材之间的关系,整合成一个连贯的输出。

怎么用

Gemini Omni Flash 已上线,可通过以下入口使用:

  • Gemini App:选择"生成视频"即可,Pro 账户每天有 3 次生成机会
  • Google Flow:专业视频创作工具
  • YouTube Shorts / YouTube Create App:本周起免费使用
  • API:未来几周向开发者和企业客户开放

Omni 提供 18 种预设风格,包括 80 年代 MV、蒙太奇、美漫、涂鸦特效、像素冒险等。

所有 Omni 生成的视频都包含肉眼不可见的 SynthID 数字水印,可以在 Gemini 应用和 Chrome 中验证来源。

价格

  • 面向 Google AI Plus、Pro 和 Ultra 订阅用户开放
  • Pro 账户每天 3 次生成机会
  • Omni Pro 更强版本"即将推出"

适合谁

  • 短视频创作者:手机拍一段素材,对话式修改成成品
  • 内容营销团队:快速生成品牌风格的教学视频、产品演示
  • 教育内容制作者:用一句话把抽象概念变成可视化教学视频
  • 视频编辑师:Omni 不是替代剪辑软件,而是提供一种新的"对话式编辑"工作流
所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Gemini Omni 是什么核心能力对话式视频编辑物理模拟知识驱动的视频生成任意素材输入怎么用价格适合谁

相关文章

iOS 27 Siri大变身:独立App、多轮对话、灵动岛深度整合
AI产品

iOS 27 Siri大变身:独立App、多轮对话、灵动岛深度整合

iOS 27中Siri获得独立App形态,支持多轮对话和屏幕感知,Apple Intelligence深度整合灵动岛,但国行用户暂时无法使用

avatar for toolin小编
toolin小编
2天前
字节Lance:3B参数打通图像视频看画改全链路
AI产品

字节Lance:3B参数打通图像视频看画改全链路

字节跳动开源Lance,仅3B激活参数的原生统一多模态模型,同时覆盖图像视频的理解、生成和编辑,开源即登Hugging Face Trending第一。

avatar for toolin小编
toolin小编
2天前
Claude Fable 5 与 Mythos 5 发布
AI产品

Claude Fable 5 与 Mythos 5 发布

Anthropic发布Mythos级旗舰模型,Fable 5面向所有用户开放,软件工程基准SWE-bench Pro拿下80.3%,定价输入10美元/百万token。

avatar for toolin小编
toolin小编
7小时前