OpenAI表示它可以从15秒的音频中克隆出声音
OpenAI 刚刚宣布近期进行了小规模预演一个名为“语音引擎”的新工具的诞生。这是一种声音克隆技术,可以通过分析 15 秒的音频样本来模仿任何说话者。该公司表示,它可以生成“自然的语音”和“情感丰富且真实的声音”。
该技术基于本公司预先存在的文本转语音 API自 2022 年以来,这项工作一直在进行中。OpenAI 已经在使用该工具集的一个版本来支持当前文本转语音 API 和 Read Aloud 功能中可用的预设语音。该公司的官方博客上有一堆样本,它们听起来非常接近真实的东西。我鼓励你倾听他们的声音并想象各种可能性,无论是好的还是坏的。
OpenAI 表示,他们认为这项技术对于阅读辅助、语言翻译以及帮助那些患有突发性或退化性言语疾病的人很有用。该公司提出了一个布朗大学试点计划该项目通过创建从学校项目录制的音频中提取的语音引擎克隆来帮助患有言语障碍问题的患者。
尽管有潜在的好处,坏人肯定会滥用这项技术来从事一些严重的深度造假蠢事,这已经是一个问题了。考虑到这一点,语音引擎还没有完全准备好迎接黄金时段,因为在全面推出之前必须解决严重的隐私问题。
OpenAI 承认这项技术存在“严重的风险,这在选举年尤其值得关注”。该公司表示,它吸收了“来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴”的反馈,以确保产品发布时风险最小。所有预览测试人员都同意 OpenAI 的使用政策,该政策禁止在未经同意或合法权利的情况下冒充他人。
此外,任何使用该技术的人都必须向观众透露这些声音是人工智能生成的。 OpenAI 实施了安全措施,例如使用水印来追踪任何音频的来源,以及对系统的使用方式进行“主动监控”。当该产品正式推出时,将会有一个“禁止语音列表”,可以检测并阻止人工智能生成的与名人过于相似的扬声器。
至于何时推出,OpenAI 仍然守口如瓶。TechCrunch 发现了一些潜在的定价数据看起来它会削弱ElevenLabs 等该领域的竞争对手。语音引擎每 100 万个字符的成本为 15 美元,相当于大约 162,500 个单词。这大约是斯蒂芬·金的《闪灵》的长度。这听起来确实是一种预算友好的完成有声读物的方式。营销材料还提到“高清”版本的价格是其两倍,但该公司尚未详细说明其具体运作方式。
OpenAI 本周有重大动作。它刚刚宣布与其好朋友微软建立另一项合作伙伴关系,共同打造一款名为“Stargate”的基于人工智能的超级计算机。据报道,该项目将耗资1000亿美元,根据信息。
推荐阅读
- 蓝军在伊甸园之战中击溃莫阿娜
- 阿森纳和曼城战平后利物浦登顶
- 勇士队背靠背战胜骑士队
- 勒福打进澳式足球联赛首个进球帮助里士满爆冷获胜
- 狼人推迟至2025年上映
- 怪异星期五2新导演
- 劳拉邓恩预测泰勒斯威夫特将成为顶级电影制片人
- 高智能方程式赛车游戏中文版游戏介绍(高智能方程式赛车游戏中文版)
- 如何用电饭锅煮饭教程,如何用电饭锅煮饭
- Oracle Red Bull Racing与Ansys续签合作伙伴关系携手迈向长距离
- MAVTV通过女性赛车运动节目庆祝女性历史月
- MDK MOTORSPORTS宣布支持职业运动员大脑健康研究
- 手机卡申请白名单证明怎么写,手机白名单在哪里
- 霍华德大学与True Voice合作优先考虑学生健康
- 卡洪谷总监DavidMiyashiro博士与教育部共同启动2024年国家教育技术计划
- 全球更多的学生将能够通过安全物理密码的闪存快速访问设备和学习应用程序
- 车架号是什么在哪里看,车架号是什么
- 淮南二中需要多少分?淮南二中历年录取分数线及自主招生情况
- 星三角启动电路图实物接线图,星三角启动电路图工作原理和星三角启动电路实物接线讲解
- 漱口水的正确使用方法你真的会吗,漱口水的正确使用方法