艾巴生活网

您现在的位置是:主页>科技 >内容

科技

ChatGPT 4首次在人工智能聊天机器人中获得第二名

2024-03-29 09:17:22科技传统的飞鸟
Anthropic 的先进 Claude 3 Opus 自去年推出以来首次取代 OpenAI 的 GPT-4,在 Chatbot Arena 排行榜上占据榜首。LMSYS Chatbo

Anthropic 的先进 Claude 3 Opus 自去年推出以来首次取代 OpenAI 的 GPT-4,在 Chatbot Arena 排行榜上占据榜首。

ChatGPT 4首次在人工智能聊天机器人中获得第二名

LMSYS Chatbot Arena 使用独特的方法对 AI 模型进行基准测试,重点关注人类判断。参与者在盲测中对两个不同模型的反应进行评估和排名,使用相同的提示来评估表现。

OpenAI的 GPT-4 在很长一段时间内主导了这一基准,以至于任何接近其性能的 AI 模型都被称为“GPT-4 级别”。因此,克劳德三世的成就尤为重大和值得关注。

虽然 Claude 在这些结果中超过了 GPT-4,但值得注意的是,两个模型之间的分数差异很小。 Claude 3 的领先地位可能不会维持太久,尤其是在 GPT-4.5 即将发布的情况下。

聊天机器人竞技场由大型模型系统组织 (LMSys) 管理,拥有一系列参与匿名随机战斗的大型语言模型。自去年推出以来,该基准测试已获得超过 40 万用户投票。从历史上看,OpenAI、Google 和 Anthropic 的 AI 模型一直位居前 10 名。不过,最近出现了一些开源模型,例如 Mistral 和阿里巴巴的产品,也占据了前十名。