先做个广告:需要购买Gemini帐号或代充值Gemini会员,请加微信:gptchongzhi
近日,关于谷歌旗下AI助手Gemini即将推出视频生成功能的传闻引发广泛关注,目前多方信息显示,这一消息具有较高可信度,且已得到谷歌方面的部分官方证实,表明该功能确实在积极开发中,具体的产品形式、可用功能细节以及确切的公开发布时间,仍未完全明确,业界普遍期待谷歌能借此在AI视频生成领域迎头赶上,但用户仍需等待官方更完整的公告以获取最终确认。
本文目录导读:
推荐使用Gemini中文版,国内可直接访问:https://ai.gpt86.top
以下是基于目前信息(截至2024年5月)的梳理和分析:
核心进展:Google Veo的发布
在2024年5月的Google I/O开发者大会上,谷歌正式发布了其最新的AI视频生成模型——Veo,它可以生成长达60秒的1080p高清视频,在视频质量、连贯性和对提示词的理解上,都展现了与当前行业领先者(如OpenAI的Sora)竞争的实力。
关键在于,谷歌已经明确表示,Veo的“部分功能”将很快集成到Gemini产品中。 这直接证实了“Gemini将新增AI视频生成功能”这一方向。
可能的整合形式与时间线
-
短期形式(已在测试中):
- 最可能首先在Gemini Advanced(付费订阅服务)中推出,作为一项高级功能。
- 可能会像文生图功能一样,通过文字提示(
/videoprompt)或直接在聊天界面中输入指令来生成视频。 - 初期可能对生成次数、视频长度有所限制。
-
中期发展:
- 与Gemini现有的多模态能力深度结合。
- “扩展生成”:根据你上传的一张图片,让Gemini生成一段以此图为开头的视频。
- “故事板生成”:根据一段复杂的叙述,生成分镜头视频脚本或直接输出视频。
- 与Google生态系统整合:可能直接输出到YouTube Shorts、Google Slides等产品中。
- 与Gemini现有的多模态能力深度结合。
-
竞争对手与市场格局:
- 谷歌此举直接对标OpenAI的Sora(尚未公测)和Runway、Pika Labs等AI视频初创公司。
- Gemini的优势在于其多模态统一模型架构,视频生成将与文本、图像、语音理解无缝衔接,提供更连贯的创作体验。
- 谷歌拥有庞大的用户基础(通过Android、Gmail、YouTube等)和云基础设施,有利于快速推广和迭代。
需要注意的关键点
- 不是“将新增”,而是“正在新增”:谷歌已经官宣了Veo及其与Gemini的整合计划,只是尚未全面开放给所有用户。
- 技术门槛与访问限制:由于AI视频生成的计算成本极高,初期很可能仅限付费用户或通过等待名单(Waitlist)形式逐步开放。
- 内容安全与审核:AI生成视频的滥用风险(如深度伪造)极高,谷歌一定会内置严格的内容过滤和安全控制机制。
- 版权与伦理问题:使用该功能生成的视频版权归属、训练数据来源等将是持续的关注焦点。
是的,谷歌Gemini新增AI视频生成功能是确定的方向,其核心技术就是Veo模型。
对于普通用户来说,可以期待在未来几个月内,在Gemini Advanced或特定测试渠道中体验到这一功能,它将极大地扩展AI助手的内容创造力,从生成文本和图片,升级到直接生成动态视频内容。
建议保持关注谷歌官方对Gemini的更新公告,并可以提前了解和学习优秀的AI视频生成提示词技巧,为使用该功能做好准备。


