Gemini Omni - AI 视频生成器

用提示词、图片、参考素材和头像概念,通过 Gemini Omni 生成工作流创作多模态视频。

生成
选择模式,并在下方填写描述

从文本描述生成视频

API 参数:prompt 必填。Gemini Omni 支持 4s、6s、8s、10s 生成时长,支持 16:9 或 9:16 比例;图片最多 7 个公开 URL,audio ID 最多 1 个,视频参考最多 1 个源视频,源视频不超过 30 秒,选取片段不超过 10 秒。
0 / 5000 字符

生成视频的时长:4s、6s、8s 或 10s。

积分消耗会按清晰度变化;填写视频参考时按有视频输入的固定价格扣除。

来自 gemini-omni-audio 的音频 ID,最多 1 个。

视频参考片段(可选)

源视频需不超过 30 秒;选取片段必须不超过 10 秒。

消耗: 50 点数余额: 0 点数
点数不足购买点数
视频预览
生成的视频会显示在这里
Gemini Omni 视频

Gemini Omni AI 视频生成器
多模态创意短片工作流

Gemini Omni 把任何想法变成视频画布。文本提示词、参考图、粗剪片段、音频方向、模板和头像概念,都可以进入同一个创作流程。现在就用 Gemini Omni 视频引擎开始生成。

Gemini Omni | AI 视频生成器 | 多模态视频生成器 | 头像视频 | 聊天式视频编辑 | 视频重混 | Gemini Omni 模型
文本 + 图片
多模态提示
Avatar
自拍头像概念
Gemini Omni
生成模型

为什么使用 Gemini Omni

Gemini Omni 被包装为一站式视频创作页,适合快速提示词、视觉参考、头像概念、视频重混和电影级输出。

文本、图片、音频、视频共用一张画布

把提示词、参考图、场景说明、声音方向和粗剪视频想法放进同一个顺滑的创作流程。

聊天式生成、重混与模板

先得到第一版结果,再继续微调:保留场景、调整动作、改变光照、套用模板,或重新设定机位。

头像驱动的视频概念

规划用自拍或人像引导个人头像、产品主持人、虚拟讲解员或连续角色的短视频。

更强的物体、运动与光照表达

围绕可信的物体交互、干净的场景构图、真实动作和连续光照来组织视频提示词。

Gemini Omni 创作工作流

用 Gemini Omni 快速测试创意短片、产品动效、社媒内容、头像场景和可重混的视频概念。

创意到多模态视频

从一句提示词开始,加入参考图或场景方向,生成贴合目标风格的电影感片段。

自拍到头像场景

规划用自拍或人像引导个人头像、产品主持人、虚拟讲解员或角色插入的短视频。

通过聊天重混和微调

组织后续编辑提示词:保留原场景,调整动作,改变光照,替换背景,或重新设定机位。

Gemini Omni 常见问题

快速了解 Gemini Omni 的能力定位,以及当前 Gemini Omni 生成工作流。

开始生成 Gemini Omni 视频

回到上方生成器,用本站当前可用的 Gemini Omni 引擎,先原型验证你的多模态视频想法。

返回生成器