您现在的位置是：主页>科技 >内容

科技

谷歌的Imagen2模型可以生成四秒的视频剪辑

2024-04-12 09:14:40科技传统的飞鸟

在Google Cloud Next 2024 上，这家搜索巨头推出了新的云硬件，并发布了许多产品，主要面向企业客户。其中，Imagen 2 型号脱颖而出，

在Google Cloud Next 2024 上，这家搜索巨头推出了新的云硬件，并发布了许多产品，主要面向企业客户。其中，Imagen 2 型号脱颖而出，因为它可以根据文本提示创建长达四秒的短视频剪辑。

它仍然是一个文本到图像的模型，谷歌将其称为文本到实时图像的模型。与生成具有静态照片和一定程度运动的 AI 视频不同，Imagen 2 可以显示不同的摄像机角度，并且整个场景也具有一致性。

也就是说，该模型只能以640 x 360的低分辨率输出视频剪辑(又称实时图像)。谷歌正在向企业客户推销 Imagen 2，包括营销人员和创意人员，他们可以快速生成广告、活动等短片。

除此之外，谷歌正在使用其 SynthID 技术在人工智能生成的剪辑和图像上应用隐形水印。该公司表示 SynthID 可以承受编辑甚至压缩。除此之外，谷歌还对图像生成模型进行了安全性和偏见的过滤。

必须指出的是，谷歌最近因拒绝生成白皮肤人的图像而受到批评。事件发生后，谷歌暂停了人类图像生成，甚至两个月后，该公司仍未解除对 Gemini 的限制。

也就是说，Imagen 2 已在 Vertex AI 上普遍可供企业客户使用。它现在还支持修复和修复，能够使用 AI 编辑图像、扩展边框或添加/删除图像的某些部分。 OpenAI 最近还为 Dall -E生成的图像带来了图像编辑功能。

虽然 Imagen 2 模型可以生成长达四秒的视频剪辑，但我不确定它如何与其他文本到视频生成器竞争。 Runway以更高的分辨率提供长达 18 秒的视频生成，OpenAI 最近推出了其突破性的Sora 模型。为了与这些模型竞争，谷歌必须提出一个更强大的扩散模型。