xAI的Grok最新版本可以处理图像
由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1 5V是该公司的第一代多模态,它不仅可以
由埃隆·马斯克创立的 OpenAI 竞争对手xAI推出了第一个可以处理视觉信息的 Grok 版本。 Grok-1.5V是该公司的第一代多模态,它不仅可以处理文本,还可以处理“文档、图表、屏幕截图和照片”。在 xAI 的公告中,它给出了一些如何在现实世界中使用其功能的示例。例如,你可以向它展示一张流程图照片,并要求 Grok 将其翻译成 Python 代码,让它根据绘图写一个故事,甚至让它解释一个你无法理解的模因。嘿,不是每个人都能跟上互联网上吐出的一切。
新版本是在该公司发布Grok-1.5几周后发布的。该模型的设计目的是比其前身更擅长编码和数学,并且能够处理更长的上下文,以便它可以检查来自更多来源的数据,以更好地理解某些查询。 xAI 表示,其早期测试人员和现有用户很快就能享受 Grok-1.5V 的功能,但没有给出具体的推出时间表。
除了推出 Grok-1.5V 之外,该公司还发布了一个名为 RealWorldQA 的基准数据集。您可以使用 RealWorldQA 的 700 张图像中的任何一张来评估 AI 模型:每个项目都附带您可以轻松验证的问题和答案,但这可能会难倒 Grok 等多模态模型。 xAI 声称,当该公司使用 RealWorldQA 与 OpenAI 的 GPT-4V 和 Google Gemini Pro 1.5 等竞争对手进行测试时,其技术获得了最高分。
推荐阅读
- 电子元器件识别与检测文章(电子元器件识别与检测)
- 情侣之间幽默寻人启事?(情侣笑话)
- 怎样能长高最快的方法12岁,怎样能长高!
- 进入NBA附加赛的球队是通过选秀乐透抽签的吗
- 百度网盘提取文件入口,BT种子在百度网盘上怎么用
- 火星网校官方版(火星时代OL)软件介绍(火星网校官方版(火星时代OL))
- Truke Buds Q1 Lite耳机总播放时间长达48小时支持快速充电
- 微软的Windows 11 Beta测试者可能会开始在开始菜单中看到广告
- 我们最喜欢的索尼无线耳机以创纪录的低价出售
- 星际穿越将于9月重返影院庆祝上映10周年
- 如何看自己电脑的wifi密码,怎么看自己电脑的wifi密码
- 22款起亚k5凯酷1.5t值得买吗?(东风悦达起亚k5凯酷)
- 只输入车牌号能查询汽车违章吗?(只输入车牌号查违章)
- 体育教学计划的意义?(体育教学计划)
- 丙酮会改变树脂特性吗?(丙酮的危险特性)
- FIFA Online3m最新版游戏介绍(FIFA Online3m最新版)
- 住院需要准备的物品清单,住院要准备哪些物品
- 酷家乐如何使用别人地板,酷家乐如何使用
- 怎么解除脱机工作模式,怎么解除脱机工作