艾巴生活网

您现在的位置是:主页>科技 >内容

科技

谷歌的Imagen2模型可以生成四秒的视频剪辑

2024-04-12 09:14:40科技传统的飞鸟
在Google Cloud Next 2024 上,这家搜索巨头推出了新的云硬件,并发布了许多产品,主要面向企业客户。其中,Imagen 2 型号脱颖而出,

在Google Cloud Next 2024 上,这家搜索巨头推出了新的云硬件,并发布了许多产品,主要面向企业客户。其中,Imagen 2 型号脱颖而出,因为它可以根据文本提示创建长达四秒的短视频剪辑。

谷歌的Imagen2模型可以生成四秒的视频剪辑

它仍然是一个文本到图像的模型,谷歌将其称为文本到实时图像的模型。与生成具有静态照片和一定程度运动的 AI 视频不同,Imagen 2 可以显示不同的摄像机角度,并且整个场景也具有一致性。

也就是说,该模型只能以640 x 360的低分辨率输出视频剪辑(又称实时图像)。谷歌正在向企业客户推销 Imagen 2,包括营销人员和创意人员,他们可以快速生成广告、活动等短片。

除此之外,谷歌正在使用其 SynthID 技术在人工智能生成的剪辑和图像上应用隐形水印。该公司表示 SynthID 可以承受编辑甚至压缩。除此之外,谷歌还对图像生成模型进行了安全性和偏见的过滤。

必须指出的是,谷歌最近因拒绝生成白皮肤人的图像而受到批评。事件发生后,谷歌暂停了人类图像生成,甚至两个月后,该公司仍未解除对 Gemini 的限制。

也就是说,Imagen 2 已在 Vertex AI 上普遍可供企业客户使用。它现在还支持修复和修复,能够使用 AI 编辑图像、扩展边框或添加/删除图像的某些部分。 OpenAI 最近还为 Dall -E生成的图像带来了图像编辑功能。

虽然 Imagen 2 模型可以生成长达四秒的视频剪辑,但我不确定它如何与其他文本到视频生成器竞争。 Runway以更高的分辨率提供长达 18 秒的视频生成,OpenAI 最近推出了其突破性的Sora 模型。为了与这些模型竞争,谷歌必须提出一个更强大的扩散模型。