Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

爆料!传阿里人靠脸吃饭,真相是......

从进出办公大楼到会议室,从取快递到食堂吃饭,只需对准摄像头刷一下脸,就能轻松完成通行、支付、取件等操作。在阿里巴巴,“脸”已经成为员工日常生活办公的通行证。

阿里园区食堂使用人脸支付

作为园区“刷脸”的主要技术支持方,阿里巴巴信息平台事业部园区大脑技术团队负责人杨含飞(花名:少昊)表示,今年1月初,第一台人脸闸机才正式在园区落地。而现在,“人脸”已经运用在阿里园区的方方面面,平均每天会进行20多万次的人脸识别

此外,随着会议活动对安防要求的增加,一些大型展会对人脸识别的需求也变得越来越强烈。在今年9月云栖大会上,阿里内部的这套人脸闸机,支持现场12万人次的通行。

云栖大会上的人脸门禁

那么,在这些大规模的人员识别场景中,阿里内部的人脸识别究竟是如何做保障的?

今天,我们邀请少昊亲自揭秘阿里巴巴人脸识别的优化方案。

人脸识别时,首先需要对方提供一张照片进行人脸注册,然后在识别过程中,通过终端照片去检测当前画面照片上是否有人脸出现。如果有就会去提取特征并与服务端算法进行对比,来确认两者之间是否一致。可见,人脸识别实际上是特征的“提取”与“对比”。

少昊认为,在这一过程中,特征提取是否完整与充分,对比是否快速准确,与识别算法、终端软硬件以及人脸底库照片都有关系。所以,信息平台在做大型人员识别的优化时,主要从这三个方向入手:

终端的优化

终端的优化分为硬件与软件。硬件上,主要针对摄像头采用宽动态技术,IPS优化,从捕捉画面前景与背景处理上达到清晰均衡的要求,解决逆光问题,让人脸识别更加快速有效。

软件上,我们主要对拍摄清晰度做管理和控制。一般来说,在捕捉到识别图像后,首先会对每帧图像进行数据监控与评估。在经过数据化打标之后,会给图像进行分类,来考察不同清晰度下的图像通过率。以及不同清晰度与角度下,图像的实际分布情况。这能有效管控识别速度与识别距离,确保整个识别过程的通行效率。

识别算法的优化

误识率是人脸识别的基础,所以在识别算法上,技术人员一是对误识进行控制;二是对相似度进行管理。

因为受算法性能影响,随着人脸底库的增加,算法性能会逐步降低。如何在识别服务上进行优化,成为人脸识别的一大关键。

用户行为产生的大量数据,使数据预测成为可能。比如在杭州进行人脸识别出现误识别,本人有可能实际上正在北京出差或休假等。所以,如果结合数据算法模型来准确的预测用户行为,对人群进行合理区分的话,就能一定程度解决误识别。

基于此,团队成员在误识别上进行的第一个优化就是——分组优化。通过特征细分人群,降低误识,提高通过率。

分组优化首先需要考虑时间与空间因素。如果把一个区域空间圈得越小,未来一定时间内出现在该特定区域内的人也会越少。同时,时效越强,在该区域该时段出现的人脸也会越少。

同时,结合实际应用场景,通过业务规则与特点的判断,以及人脸识别算法的性能特性,就能更好确认合理的空间、时间以及人数的分组规模情况。

以阿里巴巴园区人脸识别取件的分组优化为例。从地域属性上来看,每个小邮局都是一个固定的空间单元,有具体的位置。从时效性来看,当包裹到达小邮局后,它的主人在一段时间内会去拿包裹。从业务属性上来看,小邮局是收取包裹快递的地方。通过这三点属性,就能基本确定取件场景的分组优化方案。判断哪些员工会去哪个小邮局的分组中。

此外,取件还会存在代领情况。这一情况在业务规则中就没法确认,需要基于历史行为去分析,一个包裹被别人代领的可能性是多少,以及被谁代领的可能性更高。然后将这一预判结果加入到人脸识别的分组中。

阿里园区小邮局通过人脸取件

通过一系列的算法模型学习优化,提升模型预测的准确性,不断的改善人员分组质量,目前人脸在支持阿里巴巴园区通行上,误识率已经有效控制在千分之一左右。

除了分组优化外,在面对不同肤色与人种的情况下,团队还建立了不同种类的算法模型与底库。这样可以针对特定肤色人种的通行率和误识率,做针对性的优化。

人员底库照片的优化

少昊表示,很多时候,人脸识别不成功并不是现场摄像头或比对算法出了问题,还是底库照片的质量太差,导致无法进行人脸识别。除了让对方重新提供照片图像外,还可以通过算法进行大小脸检测、照片校正以及身份核实,来确认本人身份。

此外,算法还可以帮助底库照片进行自学习。通过人员照片序列的分析后,提取特征进行图片聚类分析,随后再通过图片质量分析后,对本人身份进行核实,进而完成底库照片的注册与特征提取。

通过上述手段优化,在人脸识别通过率保持不变的情况下,误识率可以降到1‰。

今年双11期间,阿里园区的这套人脸识别技术还应用于双11作战指挥室与天猫双11晚会现场的安防保障。

少昊表示,通过人脸属性识别的进一步丰富,硬件及算法能力的进一步提升,未来,人脸识别技术将会满足更多商业场景需求,一个真正的刷脸时代就要来了。

阿里技术
阿里技术

分享阿里巴巴的技术创新、实战案例、经验总结,内容同步于微信公众号“阿里技术”。

专栏二维码
产业人脸识别图像处理聚类分析
2
相关数据
Qualcomm机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

http://www.qualcomm.com/
人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

聚类分析技术

聚类分析(CA)是一种典型的无监督学习方法,这种方法是根据对象的特点将它们分成不同的组。K-均值是应用最广泛的聚类方法,其它方法还包括 k-Medoids、分层聚类和 DBSCAN。期望最大化法(EM)也是聚类分析的一种解决方案。聚类分析在数据挖掘、市场调研、异常值检测等许多领域都有应用。另外,降维技术也是一类类似于聚类分析的无监督学习方法,其典型的代表有主成分分析(PCA)、线性判别分析和 Isomap。

推荐文章
暂无评论
暂无评论~