艾巴生活网

您现在的位置是:主页>科技 >内容

科技

ai,人脸识别背后的推进者是什么_AI人脸识别背后的推进者

2024-05-06 16:04:49科技帅气的蚂蚁
谷歌最近发布了一个——亚毫秒人脸检测算法Blaze Face,这是一个为移动GPU推理量身定制的轻量级人脸检测器。它可以在旗舰设备上以200-1000

ai,人脸识别背后的推进者是什么_AI人脸识别背后的推进者

谷歌最近发布了一个——亚毫秒人脸检测算法Blaze Face,这是一个为移动GPU推理量身定制的轻量级人脸检测器。它可以在旗舰设备上以200-1000 fps的速度运行,可以应用于许多需要快速准确识别人脸区域的任务,如2D/3D人脸关键点识别和几何评价、人脸特征和表情分类、人脸区域分割等。

说到“人脸识别技术”,我想大家都不会觉得陌生。“人脸识别技术”是在20世纪60年代末发展起来的,然后在90年代逐渐进入市场。该技术的准确率逐渐达到99%,一些人脸识别软件在国际标准的LFW数据库中甚至达到了99.15%的准确率,已经超越了人眼的识别能力。因此,各行各业都将人脸识别纳入了未来的规划前景,尤其是AI领域的企业,如旷视科技、易图科技、极链科技等公司都跃跃欲试。

在人脸识别技术发展的早期,典型的基于文章图像的人脸识别系统通常是自动检测人脸区域,从文章中提取特征,如果存在人脸,最后识别人脸的身份。在文章监控、信息安全和门禁控制等应用中,基于文章的人脸识别是一个非常重要的问题,也是目前人脸识别的热点和难点。基于文章的优于静态图像,因为Bruce和Knight已经证明了在人脸翻转或倒置时,运动信息有助于人脸识别。虽然文章人脸识别是基于静态图像的人脸识别的直接延伸,但一般认为文章人脸识别算法需要同时利用空间和时间信息。这种方法直到最近几年才受到重视,需要进一步研究和发展。

目前,文章人脸识别还存在很多困难和挑战。具体来说,第一,文章图像质量比较差:文章图像通常是在室外(或室内,但采集条件比较差)获取的,通常没有用户的配合,所以文章人脸图像往往存在较大的光照和姿态变化,可能存在遮挡和伪装。

二、人脸图像相对较小:同样,由于采集条件较差,文章人脸图像一般小于基于静态图像的人脸识别系统的预设尺寸。小尺寸图像不仅会影响识别算法的性能,还会影响人脸检测、分割和关键点定位的准确性,必然导致整个人脸识别系统性能的下降。

在这种情况下,提高系统识别的准确率和准确度显然成为人脸识别领域的当务之急。如何利用AI有效推动人脸识别的发展,已经成为人工智能视觉和图像领域的关键应用。

例如,文章AI领域的独角兽极链技术提出了四个模块来识别场景中的人脸:

模块1:文章结构化,将文章分成镜头。

在这个环节中,通常采用全局特征和局部特征相结合的方法。全局特征检测全局颜色分布的突变,然后利用局部特征获得的人脸识别的跟踪结果和跟踪轨迹的不连续性来判断文章是否有镜头切换。跟踪判断镜头切换有很大的优势,因为后面的步骤会采用类似的算法,所以这一步需要的算法可以复用。

模块2:人脸轨迹提取

镜头分割完成后,可以从分割后的单镜头中提取人脸轨迹。在轨迹提取算法中,还应考虑精度和速度指标。要达到速度和精度的平衡,有两种方法:一种是间隔采样或逐帧处理,另一种是检测和跟踪的配合。

模块3:人脸识别

有了人脸轨迹,就可以开始人脸识别了。但在将人脸数据输入深网之前,需要对其进行转换和处理。在人脸部分,尤其是消费类文章中,有一个环节的改造非常重要,那就是人脸对齐。人脸对齐是利用人脸的特征点进行检测和定位,将各种姿态的人脸图像恢复并校正为正面人脸的过程。在算法框架中,需要加入人脸质量评价的算法,过滤低质量的人脸图片,保证人脸数据的准确性。

在样本足够多的前提下,训练好的模型可以用来从人脸样本中提取特征。测试时,在文章中检测到人脸后,输入到生成的特征向量中,与人脸交互的特征向量进行匹配,从而在特征空间中找到最接近的样本。

模块4:识别结果融合

上面提到的人脸识别是针对单帧识别的图片,前面提到的系统识别结果是针对整个人脸轨迹。因此,最后需要将人脸识别的结果与整个人脸轨迹进行融合,得到整个轨迹的识别结果。

对于识别结果也有很多融合策略。有一个简单的投票策略,即最后一帧的识别结果为一票,票数最高的为该轨迹的最终识别结果。神经网络也可以用来实现这种融合。可以在一个时间维度上训练一个神经网络,将每一帧中识别出的特征向量作为网络的输入,在时间维度上通过一系列的参数变换得到最终的特征向量。

如果说AI是时代的浪潮,那么人脸识别就是乘风破浪的小船。在人工智能发展的今天,人脸识别可以有更高的准确率,更强的识别性,更广阔的未来。