StartDT AI Lab | 视觉智能引擎——从Face ID说起,浅析顾客数字化

Face ID​是如何成为商业智能化方案中对顾客进行数字化描述的主要技术方案的?

“顾客就是上帝”,这句西谚揭示了顾客占据着商业活动中心地位这一客观规律。为了能更好地服务顾客,优化商家自身的服务与产品,对顾客的分析与需求调研一直是商业经营分析中的重中之重。

在商业互联网化、社会数字化的今天,这一规律越发明显。从Web1.0时代开始,Cookie就被发明出来,用以对“顾客”进行数字化描述和建档并归一化其互联网下的数字行为。

其后的Web2.0时代,随着移动互联网的发展,个人生活中的屏—人机交互端口变多了,原先用Cookie对 “顾客” 进行数字化的方式已无法完成对个人全渠道全平台跨屏的行为归一化,为了解决这一问题,设备ID、SuperID应运而生。

当前, Web3.0正如火如荼地发展中,渠道、平台、终端、屏幕随着IOT的发展,通过云端赋能,下沉雾化, 对“顾客”进行数字化描述的方式又迎来了更复杂更严峻的挑战。有鉴于此,我们在多年前就开始了对于新形态“顾客ID”的预研。目前基本达成的共识有两点:

1. IOT时代来临,原来的线下物理社会逐步数字化上线,对于这一开放的数字化环境,已经难以通过唯一有限的媒介数字设备对顾客及行为数字化。这就需要从自然人身上直接数字化并抽取。2. 这一新形态数字ID需要能够较为高效和准确地拉通原先Web1.0和Web2.0时代的既有数字化信息。
 在经历了一段时间摸索后,以人脸生物特征为基础的Face ID方案逐渐显露出优势,而 Face ID也成为了当前商业智能化方案中对于顾客数字化描述的主要技术方案。基于此,StartDT  AI  Lab在人脸数字化方向上做了充分且深入的技术沉淀。下面就为大家展示几点:

人脸数字化的核心自然是人脸识别,其包含了人脸生物特征的数字化和准确比对。作为视觉智能引擎中不可或缺的一部分,StartDT  AI  Lab的人脸识别技术可以解决复杂场景下的人脸识别问题。

(真实动态场景中的人脸识别应用 )

比如动态视频监控场景下的人脸识别,相较于约束场景下的人脸验证所需的人脸识别技术,其一大挑战是对无约束人脸的识别,难度在于进行人脸识别的人脸图一般会存在模糊、遮挡、低分辨率、面部光照及表情变化巨大等,这些因素都会在一定程度上对人脸识别造成影响,甚至大幅降低人脸识别的准确率。而StartDT  AI  Lab对这种场景下的人脸识别准确率进行专项课题攻坚,主要研发采用了下面一些技术手段:

01 数据增强

当训练数据面临样本量过少、质量分布不均衡或者训练集与实际场景分布差异较大时,模型的泛化能力会严重下降,此时数据增强就很有意义;StartDT  AI  Lab通过GAN网络同时结合传统图像处理技术,进行样本合成增强。

02 图像处理

在无约束场景下,一般获取的图像质量较差,例如对人脸而言,一般分辨率较差、 模糊、遮挡、低光等,StartDT  AI  Lab通过结合传统方法和深度学习方法,对人脸图像进行去噪、去模糊、超分辨等处理,从而获得更高质量的人脸图片,提升实际场景模型准确性。

03 大规模分布式并行训练

采用多机多卡的训练方式,StartDT  AI  Lab目前支持上百万个ID,上亿张照片规模的训练数据集。

正所谓有矛就有盾,有攻就有防。自从有了数字ID,就有了对应的黑客技术来破解盗用数字ID,这一问题到了Face ID时代依然存在,并且因为Face ID所在的是开放性数字场景,攻击手段更是丰富简便了起来。

比如仅仅使用一个手机上的照片或者使用换脸APP就盗用了别人的人脸从而被认证,这样就非常容易被犯罪分子利用,人脸识别的应用范围就大打折扣了。因此,我们需要在人脸识别进行前增加活体检测加以应对。目前,人脸识别的主要攻击方法包括照片与视频回放攻击以及立体面具攻击。

我们在产品中针对不同的应用场景开发了多种活体检测方法,针对无人零售场景,需要配合交互验证的方式对用户不友好,同时需要控制成本,因此我们开发了基于单目RGB的静默活体检测方法。主要通过深度学习方式提取特征以及基于多特征融合的方法达到了目前场景下99.98%拒绝率,99.8%的通过率。目前算法已用在我们的多种场景下,时刻为我们的人脸识别系统保驾护航。

(已集成在产品上的活体检测演示)

在完成Face ID的提取之后,作为数字化需求的自然延展,视频智能引擎对人脸的相关信息也同步进行了数字化,例如年龄性别表情等。

目前,人脸年龄预测方面主要的难点在于如何协调年龄的连续性、年龄间的次序性、年龄分段的模糊性等,还有来自于实际场景中妆容、光照、角度等等的影响。

在人脸性别预测方面,主要问题在于intra-class variability,所以加大光照,角度等intra-class方面的增强数据有助于提升模型性能。

在人脸表情识别方面,碰到的难点主要有3方面:

1. 各模式(光照,姿态等)下表情数据集不足;

2. 由于年龄、性别、种族、表情强度等因素不同造成high inter-subject variations;

3.  由于光照、姿态、遮挡等因素造成的large intra-class variability。

目前StartDT AI  Lab选择的年龄性别表情预测与识别算法在以上问题的解决方面有了很大的突破,再通过大数据样本的训练,取得了相较于目前市面上主流人脸年龄性别表情API更高的性能指标。

通过以上的技术展示,相信读者对人脸相关技术能力有了一定了解,也对Face ID为主的Web3.0时代的“顾客”数字化描述这一主要方式有了一定认识。从目前我们在Web3.0的实践来看,Face ID在头部20%高净值VIP客户的服务中能有充分的数字化保障,这也直接提高商家在商业模式中80%预期收益的落袋能力。然而对于剩下20%的预期收益,由于其分散在80%长尾客群的稀疏商业行为中,如何以低成本的方式提高这部分预期收益的落袋向来是商业场景中的难点。有鉴于此,我们从技术的角度解构了这部分商业场景,并通过技术的一次次突破,不断地提升着预期收益的上限。



奇点云 | StartDT
奇点云 | StartDT

数据智能是未来商业的源动力,奇点云打造的AI驱动的数据中台,基于大数据计算平台、自主研发的视觉计算技术和覆盖多场景的智能终端。帮助企业实现数据采集自动化、数据处理智能化、数据资产私有化、数据应用敏捷化,加快企业创新步伐,实现数据生命周期管理,将数据智能应用到企业经营的各个环节,降低成本,提高效率,协同企业跨越数据智能大规模应用的奇点,让商业更智能。

产业计算机视觉智能物联网图像处理人脸识别人机交互
51
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

商业智能技术

商业智能(Business Intelligence,BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
face id 才是未来
1