8秒720p视频限制
尽管Veo 2能够生成时长为数分钟的4K视频,但Gemini Advanced用户仅限于创建分辨率为720p、16:9横屏格式的八秒短片。这一限制显著缩减了该模型的完整功能,而这些功能被谷歌保留用于特定产品,如VideoFX、YouTube和Vertex AI。此外,谷歌对用户每月可生成的视频数量设定了上限,但具体限制未公开——用户仅在接近阈值时会收到通知。
八秒的时长策略性地与现代注意力跨度相符,因为研究表明,观众通常会在大约八秒内决定内容是否值得观看。尽管存在这些限制,该模型仍然提供了令人印象深刻的功能,包括逼真的物理模拟、准确的人体解剖表现,以及从写实到幻想等特定视觉风格的支持。每个生成的视频还会通过谷歌的SynthID技术加上水印,以标识AI生成的内容。
SynthID 水印技术
谷歌的DeepMind开发了SynthID,这是一种创新的水印技术,可以将不可见的数字签名嵌入到包括文本、图像、音频和视频在内的AI生成内容中。该系统使用了两个神经网络:一个在生成内容时进行微妙修改(例如调整文本中的标记概率或更改图像中的像素),另一个则检测这些嵌入的水印3。对于由Veo 2生成的视频,SynthID水印会自动应用,创建一个即使内容被裁剪、重新着色或以其他方式修改后仍然存在的持久标识符。
水印过程保持了内容质量和用户体验——谷歌对超过2000万Gemini应用用户的大规模测试表明,带水印和不带水印的内容之间没有明显差异。这项技术代表了谷歌在AI生成媒体透明性方面的努力,可能允许观众验证内容来源,同时为内容创作者保留创作的可能性。SynthID水印设计为只能通过专门的软件检测,而不是被人类观众直接看到。
搅拌动画集成
Whisk Animate 代表了谷歌在其 AI 创意工具方面的最新扩展,允许 Google One AI Premium 订阅者使用 Veo 2 模型将静态图像转换为动态的 8 秒视频剪辑。此功能基于 2024 年 12 月推出的原始 Whisk 平台,该平台最初专注于通过结合文本和视觉提示生成图像。
动画过程非常简单——用户可以通过 Whisk 的现有界面生成图像,然后点击“ANIMATE”按钮使他们的创作栩栩如生。与传统视频编辑需要技术专业知识不同,Whisk Animate 提供了一个简化的创意工作流程,用户可以通过动画化 AI 生成或上传的图像快速可视化概念。通过该平台创建的所有视频都包含 SynthID 水印,以清楚地标识它们为 AI 生成内容,反映了谷歌对负责任 AI 使用的重视。
原创文章,作者:猫爪社区,如若转载,请注明出处:https://www.meowzo.com/google-launches-veo-2-ai-video-generator-for-gemini-advanced/