艾巴生活网

您现在的位置是:主页>互联网 >内容

互联网

专家表示Meta的新细分市场任何识别模型都非常重要

2023-04-18 09:10:24互联网传统的飞鸟
随着检测和识别物体的能力的提高,计算机越来越接近人类的视觉感知水平。Meta 正在推出一种 AI 图像分割模型,该模型可以看到并隔离图像

随着检测和识别物体的能力的提高,计算机越来越接近人类的视觉感知水平。

专家表示Meta的新细分市场任何识别模型都非常重要

Meta 正在推出一种 AI 图像分割模型,该模型可以看到并隔离图像中的对象,即使它以前从未见过它们。该模型称为 Segment Anything (SAM),可带来更快、更准确的图像识别,并减少对人类标记对象的依赖。

Encord总裁Ulrik Stig Hansen 表示:“SAM 的灵活性使其能够应用于各种行业和用例,例如农业、零售、医学影像和地理空间影像,从而改善结果并提高效率。”一家最近将 SAM 集成到其产品中的软件公司在电子邮件采访中告诉 Lifewire。

人工智能中的图像分割

Meta 的软件对计算机视觉研究人员来说可能是一个重大的福音。Meta 研究人员在博客文章中写道,SAM 是一种图像分割模型,可以响应文本提示或用户点击以隔离图像中的特定对象。

计算机视觉领域的一个基本问题是如何让软件识别和理解它以前没有见过的物体。SAM 使用的方法是图像分割,它涉及将图像分成多个片段或区域,每个片段或区域代表一个特定的对象或感兴趣的区域。

SAM 使用交互式分割,由人工通过改进结果来指导模型,以及自动分割,模型在对数百或数千个带注释的对象进行训练后自行完成。用于教授 SAM 的数据集包含从 1100 万张许可和隐私保护图像中收集的超过 11 亿个分割蒙版,这意味着它的蒙版数量是任何现有数据集的 400 倍。

庞大的数据集让 SAM 可以泛化新类型的对象和图像,超出其训练对象。因此,研究人员声称 AI 从业者将不再需要收集自己的分割数据,而是可以使用开源 SAM 模型。

SAM 在识别物体方面处于领先地位,并且已经了解了事物是什么的一般概念。它可以为任何图像或视频中的任何对象生成“掩码”,甚至可以为它以前没有遇到过的对象和图像生成“掩码”。掩蔽涉及根据对象边缘对比度的变化来识别对象,并将其与场景的其余部分分开。Meta 研究人员表示,SAM 的通用性足以满足多种用途。

研究人员说:“未来,SAM 可用于帮助需要在任何图像中查找和分割任何对象的众多领域中的动力应用程序。” “对于 AI 研究社区和其他人来说,SAM 可以成为更大的 AI 系统的一个组成部分,以便对世界进行更普遍的多模态理解,例如,理解网页的视觉和文本内容。在 AR/VR 领域,SAM 可以实现选择基于用户注视的对象,然后将其“提升”为 3D。”

更好的物体识别

Gradient Insight的首席执行官、技术分析师Iu Ayala Portella在一封电子邮件中表示 ,Meta 的新工具将意味着更准确、更高效的图像识别。例如,社交媒体平台可能能够自动识别和标记您照片中的对象,即使它们不是通常被识别的对象。“或者,想象一辆能够更好地检测和绕过意想不到的障碍物的自动驾驶汽车,”波特尔说。

SAM 是对计算机如何看待事物的越来越多的改进之一。谷歌还为其人工智能图像识别系统开发了多种对象检测方法,其中一些方法与 Meta 使用的方法类似。例如,有Single Shot Multibox Detector (SSD),这是一种由 Google 开发的对象检测方法,它使用单个深度神经网络来检测图像中的对象。

但观察人士表示,SAM 作为一种开源模型是独一无二的。

“Meta 最近发布的新物体识别和分离模型是计算机视觉向前迈出的一大步,” Infatica的主管Vladimir Fomenko在一封电子邮件中说。“这种方法被证明是必不可少的,因为它使机器能够学习和识别它们以前从未见过的照片中的项目,从而显着扩展它们的能力。自动化任务,例如识别和分类事物、定位产品缺陷和改进图片搜索结果,都可以通过这项创新的帮助。”