Stable Diffusion背后的人工智能初创公司现在正在测试生成视频
开发商 Stability AI宣布,Stable Diffusion 的生成艺术现在可以动画化。该公司在研究预览版中发布了一款名为“稳定视频扩散”的新产品,允许用户从单个图像创建视频。该公司写道:“这种最先进的生成人工智能视频模型代表了我们为各种类型的每个人创建模型的旅程中迈出的重要一步。”
新工具以两个图像到视频模型的形式发布,每个模型都能以 576 × 1024 分辨率、每秒 3 到 30 帧的速度生成 14 到 25 帧。它能够从单帧进行多视图合成,并在多视图数据集上进行微调。该公司表示:“在以基础形式发布时,通过外部评估,我们发现这些模型在用户偏好研究中超越了领先的封闭模型。”并将其与文本到视频平台 Runway 和 Pika Labs进行了比较。
稳定视频扩散目前仅可用于研究目的,不适用于现实世界或商业应用。Stability AI 写道,潜在用户可以注册加入候补名单,以获得“即将推出的具有文本到视频界面的网络体验”。该工具将展示广告、教育、娱乐等领域的潜在应用。
上面视频中显示的样本似乎质量相对较高,与竞争对手的生成系统相匹配。然而,该公司写道,它有一些局限性:它生成相对较短的视频(不到 4 秒),缺乏完美的真实感,除了慢摇镜头外无法进行相机运动,没有文本控制,无法生成清晰的文本,并且可能无法正确生成人物和面孔。
该工具在包含数百万个视频的数据集上进行了训练,然后在较小的数据集上进行了微调,Stability AI 仅表示它使用了可公开用于研究目的的视频。鉴于 Stability AI 最近因窃取其图像档案而被 Getty Images 起诉,数据集的来源很重要。
视频是生成式人工智能的一个关键目标,因为它具有简化内容创建的潜力。然而,它也是一种最有可能因深度造假、侵犯版权等而被滥用的工具。TechCrunch指出,与 OpenAI 的 ChatGPT 产品不同,Stability 在其 Stable Diffusion 产品商业化方面不太成功,并且现金消耗率很高。上周,Stability AI 音频副总裁 Ed Newton-Rex因使用受版权保护的内容来训练生成而辞职。
推荐阅读
- ChatGPT的语音聊天功能正在向免费用户推出
- 2023北京到南昌火车时刻表查询,从北京到南昌高铁最新消息
- ad7606差分输入,ADM2483差分总线收发器及特性及其应用介绍
- 雷蛇黑色星期五促销游戏外设高达65%折扣
- 谷歌Meet的举手功能变得更加真实
- 安卓14谷歌的发布日期新功能以及您需要了解的所有其他信息
- Windows 10用户现在可以尝试微软的Copilot人工智能
- excel标准差计算,excel的标准差怎么计算
- Teenage Engineering的KO IIgroovebox采样器功能丰富且仅300美元
- 适用于iPad的苹果Magic Keyboard键盘价格降至今年最低价
- HW Electro的太阳能Puzzle将于2025年为带来可爱的微型货车
- 华为nova 12 Ultra可能会限量发售但功能丰富
- 耀之荣光套装用什么换,耀之荣光套装怎么做
- 红米K70E智能手机实时图像显示显示屏上的超低边框
- 华为P70和Nova 12系列相机传感器细节泄露
- 想与ChatGPT聊天吗现在即使是免费帐户也可以
- 小米的自由桌面怎么设置,小米自由桌面如何设置和使用【教程】
- Relativity为澳大利亚提供实践电子探索教育
- 2022年至2027年间在线学习市场规模将增长1927.9亿美元