YinTao撰写

“面部识别”虽火爆,实际落地还尚早

原本属于科幻、特工系列电影中的神奇技术,如今已开始进入到我们的生活场景。然而普及这项技术,还需要时间。

2017年9月的苹果秋季发布会,iPhoneX上装载的FaceID所具备的惊艳功能,将人们的目光吸引到了这项“魔法”一般的“刷脸”技术上。“刷脸”,专业名词叫做面部识别,属于生物识别技术的分支。

图 |  FaceID首次在iPhoneX发布会上面世

原本属于科幻、特工系列电影中的神奇技术,如今已普遍应用到我们日常生活不可缺少的手机中。

然而除了手机上,有一些公共场合也开始使用“刷脸”技术,例如进站闸机、智能门禁。

图 |  线下刷脸支付

转头问了下同事,

“你之前体验过刷脸消费么?”

“体验过啊!”

“在哪里使用的呀?”

“我家楼下的餐馆。”

“哦,是么?这家餐厅用的什么刷脸设备?你有了解了么?”

“没有啥设备,人家老板认识我”

“哦,还有这样的‘刷脸’!”

为了了解身边的人使用“刷脸”技术的相关情况,今天在公司里做了一个小调查,一是了解大家的使用体验,二是在最后向大家普(mai)及(nong)下“刷脸”背后的技术原理。

我们做了个调查

调查问题:大家用没用过面部识别的产品?用起来体验如何?

调研目的:了解身边同事使用“刷脸”功能的体验情况

调查范围: 24人,均为上班族

调研背景: 智能手机普及,面部识别技术较为成熟,已经应用于公共场合、个人手机解锁、app在线认证等

在这里,感谢24位小伙伴参与了我们的调查!

问题 Ⅰ :在公共场合,是否体验过“刷脸”(面部识别)的门禁、进站闸机(包括不限于:飞机/火车/酒店入驻)

图 |  如今可以在国内部分车站见到的人脸识别一体式闸机

在24位受访者中,有8位用户表示自己在过去一年中,体验过“刷脸”门禁、进站闸机。

图 |  出乎意料的是,一多半受访者没有体验过

这8位用户中,有6位在高铁进站时体验过“刷脸”闸机,其中一位受访者详细记得自己在广西某站闸机体验过。

2位用户曾在其它场合体验过“刷脸”门禁,其所在场合具体为:大型会议、护照签办。

其中一位受访者:

问题 Ⅱ :你每天使用人脸识别相关app、功能,使用频繁么(例如:FaceU、屏幕解锁)

在24位受访者中,有13位用户表示曾使用手机上的人脸识别;5位受访者是在支付宝app上使用。

其中两位受访者:

问题 Ⅲ :(问题1回答肯定)在使用公共场合的识别系统时,是否遇到了困难:

8位用户均表示公共场所的“刷脸机”反应速度相当快,目前没有遇到过识别上的故障,非常认同机器的准确性和速度。

图  |  “体验满分!”

问题 Ⅳ(问题2回答肯定)手机解锁是否经常“刷脸刷不开”?

图  |  “有!尤其是光线昏暗的时候  ”    

面部识别技术属于生物识别领域的一个分支,在生物识别领域,我们使用视觉、声音以及生物传感器收集生物信息,利用计算机算法对信息进行身份判别。目前最普遍的生物识别技术是指纹识别。

面部识别则是近些年,随着计算机运算性能提升、摄像设备普及慢慢进入各个应用领域的。

这也是优秀的识别算法不断演进、数据量激增的结果。掌握强大技术能力的企业,一面探寻着准确率更高的算法技术,一面推进着面部识别技术在公众领域的普及和应用。

了解面部识别,这里全是干货

01  人脸检测和面部识别的区别

人脸检测:想象在一张图片中,我们通过一个大小变化的“滑窗”来从左上到右下遍历整张图片,检测是否有我们想要找到的图像特征,如果这个特征是“眼睛”,那么如果遇到眼睛则会报告出来,同样的如果将待检测特征设定为“眼睛+嘴巴+鼻子”,那么检测器会在同时检测到特征组合的情况下报告出来。

深度学习的诞生使得“滑窗”检测方法准确率更高,通过特征金字塔,检测结果不但提升了模型鲁棒性,还拯救了先前不能准确定位人脸所在图像中得相对位置问题。

这种检测过程被称为人脸检测(Face Detection)。类似于物体检测(Object Detection)。我们通过人脸检测得到的结果是人脸是否存在(0 or 1),优秀的模型可以将检测结果回归到像素级水平(例如Mask-RCNN)。

图 |  人脸检测的概念:特征检测+坐标回归

实际上在上个世纪就有研究人员在面部识别技术领域做初步探索。

早在20世纪50年代,认知科学家就已着手对人脸识别展开研究。20世纪60年代,人脸识别工程化应用研究正式开启。当时的方法主要利用了人脸的几何结构,通过分析人脸器官特征点及其之间的拓扑关系进行辨识。

这种方法简单直观,但是一旦人脸姿态、表情发生变化,则精度严重下降。21世纪的前十年,随着机器学习理论的发展,学者们相继探索出了基于遗传算法支持向量机(Support Vector Machine, SVM)、boosting、流形学习以及核方法等进行人脸识别。2009年至2012年,稀疏表达(Sparse Representation)成为当时的研究热点。

图 |  支持向量机的二维表示

与此同时,业界也基本达成共识:基于人工精心设计的局部描述子进行特征提取和子空间方法进行特征选择能够取得最好的识别效果。Gabor及LBP特征描述子是迄今为止在人脸识别领域最为成功的两种人工设计局部描述子。

这期间,对各种人脸识别影响因子的针对性处理也属于这一阶段研究热点,比如人脸光照归一化、人脸姿态校正、人脸超分辨以及遮挡处理等。

图 |  一种人脸超分辨算法还原效果

自此之后,研究者们不断改进神经网络结构,同时扩大训练样本规模,将LFW上的识别精度推到99.5%以上。可以说,更高性能的计算芯片使得过去无法短时间内完成的神经网络训练工作变成可以实际投入的生产工具,基于深度学习的识别技术也得以完成普及。

02  面部识别的1 v 1 和1 v N 模式分别指的是什么?

1 : 1

身份验证模式本质上是计算机对当前人脸与人像数据库进行快速人脸比对并得出是否匹配的过程,可以简单理解为你本人是否和手上的身份证是否同一个人。在小调查中,“刷脸”进高铁、验票、在线支付都属于1:1的人证核验。

图 |  电子支付身份认证:典型的1:1应用场景

1 : N

模式则指的在海量的人像数据库中找出当前用户的人脸数据并进行匹配。可以理解为公安部门希望在茫茫人海中找到一个在逃嫌犯,这就属于1:N人脸识别,即从N个人脸中找出1个目标。

图  |  热点人物寻找:1:N典型的应用场景

M : N  

除了上面两种匹配模式,还有一中 M:N是通过计算机对场景内所有人进行面部识别记录并与人像数据库进行比对的过程,是动态人脸比对,能充分应用于多种场景。

例如前一段时间阿里巴巴在某大型展会上做人流量统计,来做公共安全疏导,就是动态录入人脸,将不同位置的相机采集的信息进行匹配。

03  面部识别会怎样普及、走进我们的生活?

在去年秋天(2017),美国苹果公司首席执行官手持新一代搭载原深感摄像头与全新解锁方式Face ID的iPhoneX登上发布会讲台,惊艳的FaceID从此精准的3D面部识别技术进入了人们的视野。

图 |  Infrared :红外、Flood illuminator:泛光灯、Proximity sensor:距离传感器、Ambient :光度、Dot projector:点状投射器

仔细一看,iPhoneX“小刘海”藏着好多黑科技呢!

抛开类似娱乐性质的Animoji功能,这种1:1静态比对模型,在金融、信息安全领域中潜在的商用价值巨大。在发布会现场,苹果市场营销高级副总裁菲尔·席勒表示,为了训练 Face ID,苹果收集了 10 亿张图像。

费德里希说,苹果所做的远不止这些。费德里希说:“菲尔提到我们收集了 10 亿张图像,在全球收集数据以获得广泛的地理和民族数据集。它们都用于测试和验证识别率。你在互联网上是无法获得这些东西的。”

苹果还表示,Face ID 有一项自适应性特性,所以不管你是换了个发型,蓄起大胡子还是接受了整形手术,它都能够在你“变脸”之后认出你。

Face ID 在 Secure Enclave(安全区域中) 中通过重新训练和深度学习,在设备上完成这种自我适应训练的。这些训练或者重新训练都不是在苹果的云中完成的。苹果表示他们无论如何都不会给任何人提供渠道访问数据。

在未来,1:1模型有可能最先地充分应用于重要事件的身份认证,例如考生身份的审核、酒店入住办理时人证合一,火车站人票合一认证,移动端支付等任何需要实名制等场景。

该实名认证技术基于人脸识别技术1:1人脸比对模式,并结合云脉OCR证件识别技术进行身份认证,将人与身份证上的照片进行比对,确保人证合一。

图 |  1:1身份证与面部匹配

相信未来这项识别技术可以占据目前绝大部分生物识别应用场景,融入到人们生活地各个角落。

AI锐见
AI锐见

洞察AI行业趋势

产业面部识别
2
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

遗传编程技术

遗传编程或称基因编程,简称GP,是一种从生物演化过程得到灵感的自动化生成和选择计算机程序来完成用户定义的任务的技术。从理论上讲,人类用遗传编程只需要告诉计算机“需要完成什么”,而不用告诉它“如何去完成”,最终可能实现真正意义上的人工智能:自动化的发明机器。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

流形学习技术

流形学习(manifold learning)是机器学习、模式识别中的一种方法,在维数约简方面具有广泛的应用。它的主要思想是将高维的数据映射到低维,使该低维的数据能够反映原高维数据的某些本质结构特征。流形学习的前提是有一种假设,即某些高维数据,实际是一种低维的流形结构嵌入在高维空间中。流形学习的目的是将其映射回低维空间中,揭示其本质。

特征选择技术

在机器学习和统计学中,特征选择(英语:feature selection)也被称为变量选择、属性选择或变量子集选择。 它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。

推荐文章
暂无评论
暂无评论~