艾巴生活网

您现在的位置是:主页>科技 >内容

科技

OpenAI希望与组织合作构建新的人工智能训练数据集

2023-11-10 08:52:02科技传统的飞鸟
开放人工智能正在推出一项新的合作伙伴计划,从第三方收集数据集,打算用于训练其。该倡议名为OpenAI 数据合作伙伴,将寻求大规模的私人和

开放人工智能正在推出一项新的合作伙伴计划,从第三方收集数据集,打算用于训练其。该倡议名为“OpenAI 数据合作伙伴”,将寻求大规模的私人和公共信息,据称“公众尚无法轻松在线获取”这些信息。该公司表示,它将收集的数据不一定是定量的或文本格式的——该程序还将接受图像、音频或视频。

OpenAI希望与组织合作构建新的人工智能训练数据集

值得注意的是,该公司表示,它正在寻找“任何主题”和“任何语言”的数据,只要它“表达人类意图”,它将这比作长篇文章或转录对话。OpenAI 收集的以人为中心的数据预计将帮助该公司改进工具,例如其自动语音识别技术用于转录口语单词。这一举措也与 ChatGPT 最近的扩展相一致,以支持语音查询以对话方式与用户互动。向其提供更多信息,教其如何坚持下去类似人类的对话只会进一步改进此功能以及后续功能中的其他工具。

在整个数据合作伙伴计划中进行的模型测试也将自然地扩展 OpenAI 面向消费者的能力GPT-4涡轮增压,已更新,可为用户提供更复杂、更有意义的响应。OpenAI 表示,它已经开始与感兴趣的组织合作,包括冰岛政府等权威机构。OpenAI 表示,通过精选的数据集,它正在努力提高 GPT-4 理解冰岛语查询的能力。

如果私人或公共组织想要参与该计划,代表可以提交表单在公司网站上分享有关他们打算分享的数据类型和大小的信息。数据集有两种途径。第一个是开源存档,它非常适合与训练语言模型相关的数据集。但是,向其提交的内容将公开供任何人使用。另外,OpenAI 表示,公司可以通过其私有数据集路径提交信息,该路径将用于训练专有的,该公司表示,这些模型包括他们的“基础模型”和“微调和定制模型”。建议希望对其数据保密的公司或机构这样做。但在同一方面,OpenAI 表示它并不是在寻找包含敏感或个人信息的数据集。

ChatGPT 已经为其飙升的用户群创造了记录。它有大约每周活跃用户数为 1 亿世界各地,意义隐私只会继续成为该工具的焦点。此前,三星员工曾因泄露敏感数据到。尽管OpenAI 声明它不会使用其 API 生成的数据来训练其模型,除非用户通过选择加入表单明确提交信息,否则所有人的目光都将集中在该公司如何处理通过该计划收集的数据,尤其是私人数据集。