听说刷脸也能解锁汽车了?

2019-03-04  本文已影响2人  73b73cef9a98

仅凭刷脸就能解锁汽车?没错,这不是传言,近日已有相关团队申请了“车辆授权系统和方法”的新专利。

如果这项技术得以实现,那么一个车辆就能同时拥有多个用户账户,车内环境包括音乐、座位和温度等都可以依据驾驶者个人想法和爱好来进行专属定制。

在AI智能化的今天,这还只是人脸识别应用的冰山一角,包括医疗、治安等都已开始采用该项技术。而搜狗AI研究团队也对该技术不断深入研究,针对其中的一些算法进行了升级与优化。

人脸识别的流程并不难以理解,主要分四大块:图像获取、人脸检测、人脸对齐、人脸识别。在模型训练中Gabor、LBP等经验描述子与深度学习捕捉的特征模型反馈于人脸识别比对中的特征提取与特征比对,最终输出人脸识别的结果。

而其中最难的部分是充分适应各大光线环境的人脸预处理算法,这需要在各种复杂的光线环境中提取到人脸信息,特别是移动互联网时代,摄像头拍照的地方可以在斑驳的树影下,也可以在昏暗的街灯下,以及深夜出租车内,这对算法的鲁棒性考验极大。同时还要考虑照片和视频欺诈,二次成像的光线污染等问题。

人脸检测模块有三大内容

人脸检测框(Bounding Boxes)、人脸关键点(Key Points)、人脸置信度(Face Score)。

与其各自的三大优化目标

提高召回率(Recall)、降低误检数(False Positives)、提高检测速度(FPS)。

于是,Faster R-CNN系列、SSD/RPN系列(SSH、S3FD、FaceBoxes)、级联CNN系列(CNN Cascade、MTCNN)这样提高效率的算法应运而出。

其中,搜狗AI研究团队针对现有的MTCNN算法进行了优化,在一定程度上解决了欠召回问题、过召回问题、召回排序问题、检测速度问题、资源占用问题,并在人脸对齐模块使用MTCNN检测得到的脸部5个关键点进行对齐,既降低了单次检测的费用开销,又提高了用户体验。并且为今后移动端的应用提供了技术基础。

人脸识别模块也经历了一些演变:

主干网络

损失函数

搜狗AI研究团队在人脸识别模块中投入了大量的研发成本,也取得了非常喜人的成果。其中在机器学习和深度学习中有着非常广泛的应用的Softmax系列函数起到了重要的作用。尤其在处理类似于本文关于人脸识别这样的多分类(C > 2)问题,分类器最后的输出单元需要Softmax 系列函数进行数值处理。

Softmax系列函数算法

搜狗具备成熟的人脸识别技术的现在,每个人都可以享受着搜狗的这项技术带来的福利,其中包括并不限于:

支持8000+公众人物识别;

支持十亿级别人脸库实时检索;

支持不同光照、龄段、表情下人脸检索;

支持搜狗内部人脸打卡。

其实“刷脸支付”、“面部解锁”这些运用人脸识别技术的应用早已出现在我们身边。当你的高鼻梁、桃花眼汇成一串串0与1交织的代码被机器所识别,你已经被这个时代——这个以数字而非表观识人的时代——紧紧拥抱于怀。

其实,假使人脸识别技术只留于此,着实是大炮打蚊子——大材小用。而类似于搜狗的“AI合成主播”这样的集大成者,才更有可能引领未来的方向。本文只是做一篇引子,为大家介绍人脸识别背后的一些技术原理,相信在不远的将来,结合多项前沿技术的AI视觉交互一定能为这个世界带来不同。

上一篇下一篇

猜你喜欢

热点阅读