谷歌的Imagen2模型可以生成四秒的视频剪辑
在Google Cloud Next 2024 上,这家搜索巨头推出了新的云硬件,并发布了许多产品,主要面向企业客户。其中,Imagen 2 型号脱颖而出,
在Google Cloud Next 2024 上,这家搜索巨头推出了新的云硬件,并发布了许多产品,主要面向企业客户。其中,Imagen 2 型号脱颖而出,因为它可以根据文本提示创建长达四秒的短视频剪辑。
它仍然是一个文本到图像的模型,谷歌将其称为文本到实时图像的模型。与生成具有静态照片和一定程度运动的 AI 视频不同,Imagen 2 可以显示不同的摄像机角度,并且整个场景也具有一致性。
也就是说,该模型只能以640 x 360的低分辨率输出视频剪辑(又称实时图像)。谷歌正在向企业客户推销 Imagen 2,包括营销人员和创意人员,他们可以快速生成广告、活动等短片。
除此之外,谷歌正在使用其 SynthID 技术在人工智能生成的剪辑和图像上应用隐形水印。该公司表示 SynthID 可以承受编辑甚至压缩。除此之外,谷歌还对图像生成模型进行了安全性和偏见的过滤。
必须指出的是,谷歌最近因拒绝生成白皮肤人的图像而受到批评。事件发生后,谷歌暂停了人类图像生成,甚至两个月后,该公司仍未解除对 Gemini 的限制。
也就是说,Imagen 2 已在 Vertex AI 上普遍可供企业客户使用。它现在还支持修复和修复,能够使用 AI 编辑图像、扩展边框或添加/删除图像的某些部分。 OpenAI 最近还为 Dall -E生成的图像带来了图像编辑功能。
虽然 Imagen 2 模型可以生成长达四秒的视频剪辑,但我不确定它如何与其他文本到视频生成器竞争。 Runway以更高的分辨率提供长达 18 秒的视频生成,OpenAI 最近推出了其突破性的Sora 模型。为了与这些模型竞争,谷歌必须提出一个更强大的扩散模型。
推荐阅读
- 新的苹果维修计划增强功能允许使用某些旧零件
- Fortnite将于2024年回归Coachella活动
- 排球大战电影垃圾箱之战全球上映日期公布
- 原神4.7泄露揭示了螺旋深渊的新变化
- 从房东拉的网线怎么连接路由器,从房东家拉的网线如何连接无线路由器
- 夏新和志高冰箱哪个更靠谱?(电冰箱排名前十名的品牌)
- 就像智人一样尼安德特人以结构化的方式组织他们的生活空间
- 物理学家发现新亚原子粒子的证据
- 火车站的投诉电话,华北地区火车站问询、投诉电话号码
- 苹果手机如何打文章电话在哪儿设置,苹果手机如何打文章电话
- 恒大汽车宣布恒驰5正式开启量产,10月即可交付的车,恒大汽车宣布恒驰5正式开启量产,10月即可交付!
- 办理营业执照去哪个部门办理?(营业执照办理流程)
- 运动会的加油稿 20字左右(加油稿20字)
- 电缆桥架类型及选型_电缆桥架规格型号选用方法
- iTunes 10.7 windows软件介绍(iTunes 10.7 windows)
- 95年的猪买房风水禁忌楼层,买房的七大风水禁忌
- 中国知网翻译助手在线翻译,如何利用中国知网翻译助手进行学术或专业翻译
- psd文件可以用什么打开,psd文件要用什么打开
- 淘宝怎么收藏店铺在哪里,怎样收藏喜爱的淘宝店铺